commit
						c660ff80bf
					
				|  | @ -3,6 +3,7 @@ package all | ||||||
| import ( | import ( | ||||||
| 	_ "github.com/influxdb/telegraf/plugins/elasticsearch" | 	_ "github.com/influxdb/telegraf/plugins/elasticsearch" | ||||||
| 	_ "github.com/influxdb/telegraf/plugins/kafka_consumer" | 	_ "github.com/influxdb/telegraf/plugins/kafka_consumer" | ||||||
|  | 	_ "github.com/influxdb/telegraf/plugins/lustre2" | ||||||
| 	_ "github.com/influxdb/telegraf/plugins/memcached" | 	_ "github.com/influxdb/telegraf/plugins/memcached" | ||||||
| 	_ "github.com/influxdb/telegraf/plugins/mongodb" | 	_ "github.com/influxdb/telegraf/plugins/mongodb" | ||||||
| 	_ "github.com/influxdb/telegraf/plugins/mysql" | 	_ "github.com/influxdb/telegraf/plugins/mysql" | ||||||
|  |  | ||||||
|  | @ -0,0 +1,236 @@ | ||||||
|  | // +build linux
 | ||||||
|  | 
 | ||||||
|  | /* | ||||||
|  | Lustre 2.x telegraf plugin | ||||||
|  | 
 | ||||||
|  | Lustre (http://lustre.org/) is an open-source, parallel file system
 | ||||||
|  | for HPC environments. It stores statistics about its activity in | ||||||
|  | /proc | ||||||
|  | 
 | ||||||
|  | */ | ||||||
|  | package lustre2 | ||||||
|  | 
 | ||||||
|  | import ( | ||||||
|  | 	"path/filepath" | ||||||
|  | 	"strconv" | ||||||
|  | 	"strings" | ||||||
|  | 
 | ||||||
|  | 	"github.com/influxdb/telegraf/plugins" | ||||||
|  | 	common "github.com/influxdb/telegraf/plugins/system/ps/common" | ||||||
|  | ) | ||||||
|  | 
 | ||||||
|  | // Lustre proc files can change between versions, so we want to future-proof
 | ||||||
|  | // by letting people choose what to look at.
 | ||||||
|  | type Lustre2 struct { | ||||||
|  | 	Ost_procfiles []string | ||||||
|  | 	Mds_procfiles []string | ||||||
|  | } | ||||||
|  | 
 | ||||||
|  | var sampleConfig = ` | ||||||
|  | # An array of /proc globs to search for Lustre stats | ||||||
|  | # If not specified, the default will work on Lustre 2.5.x | ||||||
|  | # | ||||||
|  | # ost_procfiles = ["/proc/fs/lustre/obdfilter/*/stats", "/proc/fs/lustre/osd-ldiskfs/*/stats"] | ||||||
|  | # mds_procfiles = ["/proc/fs/lustre/mdt/*/md_stats"]` | ||||||
|  | 
 | ||||||
|  | /* The wanted fields would be a []string if not for the | ||||||
|  | lines that start with read_bytes/write_bytes and contain | ||||||
|  |    both the byte count and the function call count | ||||||
|  | */ | ||||||
|  | type mapping struct { | ||||||
|  | 	inProc   string // What to look for at the start of a line in /proc/fs/lustre/*
 | ||||||
|  | 	field    uint32 // which field to extract from that line
 | ||||||
|  | 	reportAs string // What measurement name to use
 | ||||||
|  | 	tag      string // Additional tag to add for this metric
 | ||||||
|  | } | ||||||
|  | 
 | ||||||
|  | var wanted_ost_fields = []*mapping{ | ||||||
|  | 	{ | ||||||
|  | 		inProc:   "write_bytes", | ||||||
|  | 		field:    6, | ||||||
|  | 		reportAs: "write_bytes", | ||||||
|  | 	}, | ||||||
|  | 	{ // line starts with 'write_bytes', but value write_calls is in second column
 | ||||||
|  | 		inProc:   "write_bytes", | ||||||
|  | 		field:    1, | ||||||
|  | 		reportAs: "write_calls", | ||||||
|  | 	}, | ||||||
|  | 	{ | ||||||
|  | 		inProc:   "read_bytes", | ||||||
|  | 		field:    6, | ||||||
|  | 		reportAs: "read_bytes", | ||||||
|  | 	}, | ||||||
|  | 	{ // line starts with 'read_bytes', but value read_calls is in second column
 | ||||||
|  | 		inProc:   "read_bytes", | ||||||
|  | 		field:    1, | ||||||
|  | 		reportAs: "read_calls", | ||||||
|  | 	}, | ||||||
|  | 	{ | ||||||
|  | 		inProc: "cache_hit", | ||||||
|  | 	}, | ||||||
|  | 	{ | ||||||
|  | 		inProc: "cache_miss", | ||||||
|  | 	}, | ||||||
|  | 	{ | ||||||
|  | 		inProc: "cache_access", | ||||||
|  | 	}, | ||||||
|  | } | ||||||
|  | 
 | ||||||
|  | var wanted_mds_fields = []*mapping{ | ||||||
|  | 	{ | ||||||
|  | 		inProc: "open", | ||||||
|  | 	}, | ||||||
|  | 	{ | ||||||
|  | 		inProc: "close", | ||||||
|  | 	}, | ||||||
|  | 	{ | ||||||
|  | 		inProc: "mknod", | ||||||
|  | 	}, | ||||||
|  | 	{ | ||||||
|  | 		inProc: "link", | ||||||
|  | 	}, | ||||||
|  | 	{ | ||||||
|  | 		inProc: "unlink", | ||||||
|  | 	}, | ||||||
|  | 	{ | ||||||
|  | 		inProc: "mkdir", | ||||||
|  | 	}, | ||||||
|  | 	{ | ||||||
|  | 		inProc: "rmdir", | ||||||
|  | 	}, | ||||||
|  | 	{ | ||||||
|  | 		inProc: "rename", | ||||||
|  | 	}, | ||||||
|  | 	{ | ||||||
|  | 		inProc: "getattr", | ||||||
|  | 	}, | ||||||
|  | 	{ | ||||||
|  | 		inProc: "setattr", | ||||||
|  | 	}, | ||||||
|  | 	{ | ||||||
|  | 		inProc: "getxattr", | ||||||
|  | 	}, | ||||||
|  | 	{ | ||||||
|  | 		inProc: "setxattr", | ||||||
|  | 	}, | ||||||
|  | 	{ | ||||||
|  | 		inProc: "statfs", | ||||||
|  | 	}, | ||||||
|  | 	{ | ||||||
|  | 		inProc: "sync", | ||||||
|  | 	}, | ||||||
|  | 	{ | ||||||
|  | 		inProc: "samedir_rename", | ||||||
|  | 	}, | ||||||
|  | 	{ | ||||||
|  | 		inProc: "crossdir_rename", | ||||||
|  | 	}, | ||||||
|  | } | ||||||
|  | 
 | ||||||
|  | func (l *Lustre2) GetLustreProcStats(fileglob string, wanted_fields []*mapping, acc plugins.Accumulator) error { | ||||||
|  | 	files, err := filepath.Glob(fileglob) | ||||||
|  | 	if err != nil { | ||||||
|  | 		return err | ||||||
|  | 	} | ||||||
|  | 
 | ||||||
|  | 	for _, file := range files { | ||||||
|  | 		/* Turn /proc/fs/lustre/obdfilter/<ost_name>/stats and similar | ||||||
|  | 		 * into just the object store target name | ||||||
|  | 		 * Assumpion: the target name is always second to last, | ||||||
|  | 		 * which is true in Lustre 2.1->2.5 | ||||||
|  | 		 */ | ||||||
|  | 		path := strings.Split(file, "/") | ||||||
|  | 		name := path[len(path)-2] | ||||||
|  | 		tags := map[string]string{ | ||||||
|  | 			"name": name, | ||||||
|  | 		} | ||||||
|  | 
 | ||||||
|  | 		lines, err := common.ReadLines(file) | ||||||
|  | 		if err != nil { | ||||||
|  | 			return err | ||||||
|  | 		} | ||||||
|  | 
 | ||||||
|  | 		for _, line := range lines { | ||||||
|  | 			fields := strings.Fields(line) | ||||||
|  | 
 | ||||||
|  | 			for _, wanted := range wanted_fields { | ||||||
|  | 				var data uint64 | ||||||
|  | 				if fields[0] == wanted.inProc { | ||||||
|  | 					wanted_field := wanted.field | ||||||
|  | 					// if not set, assume field[1]. Shouldn't be field[0], as
 | ||||||
|  | 					// that's a string
 | ||||||
|  | 					if wanted_field == 0 { | ||||||
|  | 						wanted_field = 1 | ||||||
|  | 					} | ||||||
|  | 					data, err = strconv.ParseUint((fields[wanted_field]), 10, 64) | ||||||
|  | 					if err != nil { | ||||||
|  | 						return err | ||||||
|  | 					} | ||||||
|  | 					report_name := wanted.inProc | ||||||
|  | 					if wanted.reportAs != "" { | ||||||
|  | 						report_name = wanted.reportAs | ||||||
|  | 					} | ||||||
|  | 					acc.Add(report_name, data, tags) | ||||||
|  | 
 | ||||||
|  | 				} | ||||||
|  | 			} | ||||||
|  | 		} | ||||||
|  | 	} | ||||||
|  | 	return nil | ||||||
|  | } | ||||||
|  | 
 | ||||||
|  | // SampleConfig returns sample configuration message
 | ||||||
|  | func (l *Lustre2) SampleConfig() string { | ||||||
|  | 	return sampleConfig | ||||||
|  | } | ||||||
|  | 
 | ||||||
|  | // Description returns description of Lustre2 plugin
 | ||||||
|  | func (l *Lustre2) Description() string { | ||||||
|  | 	return "Read metrics from local Lustre service on OST, MDS" | ||||||
|  | } | ||||||
|  | 
 | ||||||
|  | // Gather reads stats from all lustre targets
 | ||||||
|  | func (l *Lustre2) Gather(acc plugins.Accumulator) error { | ||||||
|  | 
 | ||||||
|  | 	if len(l.Ost_procfiles) == 0 { | ||||||
|  | 		// read/write bytes are in obdfilter/<ost_name>/stats
 | ||||||
|  | 		err := l.GetLustreProcStats("/proc/fs/lustre/obdfilter/*/stats", wanted_ost_fields, acc) | ||||||
|  | 		if err != nil { | ||||||
|  | 			return err | ||||||
|  | 		} | ||||||
|  | 		// cache counters are in osd-ldiskfs/<ost_name>/stats
 | ||||||
|  | 		err = l.GetLustreProcStats("/proc/fs/lustre/osd-ldiskfs/*/stats", wanted_ost_fields, acc) | ||||||
|  | 		if err != nil { | ||||||
|  | 			return err | ||||||
|  | 		} | ||||||
|  | 	} | ||||||
|  | 
 | ||||||
|  | 	if len(l.Mds_procfiles) == 0 { | ||||||
|  | 		// Metadata server stats
 | ||||||
|  | 		err := l.GetLustreProcStats("/proc/fs/lustre/mdt/*/md_stats", wanted_mds_fields, acc) | ||||||
|  | 		if err != nil { | ||||||
|  | 			return err | ||||||
|  | 		} | ||||||
|  | 	} | ||||||
|  | 
 | ||||||
|  | 	for _, procfile := range l.Ost_procfiles { | ||||||
|  | 		err := l.GetLustreProcStats(procfile, wanted_ost_fields, acc) | ||||||
|  | 		if err != nil { | ||||||
|  | 			return err | ||||||
|  | 		} | ||||||
|  | 	} | ||||||
|  | 	for _, procfile := range l.Mds_procfiles { | ||||||
|  | 		err := l.GetLustreProcStats(procfile, wanted_mds_fields, acc) | ||||||
|  | 		if err != nil { | ||||||
|  | 			return err | ||||||
|  | 		} | ||||||
|  | 	} | ||||||
|  | 
 | ||||||
|  | 	return nil | ||||||
|  | } | ||||||
|  | 
 | ||||||
|  | func init() { | ||||||
|  | 	plugins.Add("lustre2", func() plugins.Plugin { | ||||||
|  | 		return &Lustre2{} | ||||||
|  | 	}) | ||||||
|  | } | ||||||
|  | @ -0,0 +1,144 @@ | ||||||
|  | package lustre2 | ||||||
|  | 
 | ||||||
|  | import ( | ||||||
|  | 	"io/ioutil" | ||||||
|  | 	"os" | ||||||
|  | 	"testing" | ||||||
|  | 
 | ||||||
|  | 	"github.com/influxdb/telegraf/testutil" | ||||||
|  | 	"github.com/stretchr/testify/assert" | ||||||
|  | 	"github.com/stretchr/testify/require" | ||||||
|  | ) | ||||||
|  | 
 | ||||||
|  | // Set config file variables to point to fake directory structure instead of /proc?
 | ||||||
|  | 
 | ||||||
|  | const obdfilterProcContents = `snapshot_time             1438693064.430544 secs.usecs | ||||||
|  | read_bytes                203238095 samples [bytes] 4096 1048576 78026117632000 | ||||||
|  | write_bytes               71893382 samples [bytes] 1 1048576 15201500833981 | ||||||
|  | get_info                  1182008495 samples [reqs] | ||||||
|  | set_info_async            2 samples [reqs] | ||||||
|  | connect                   1117 samples [reqs] | ||||||
|  | reconnect                 1160 samples [reqs] | ||||||
|  | disconnect                1084 samples [reqs] | ||||||
|  | statfs                    3575885 samples [reqs] | ||||||
|  | create                    698 samples [reqs] | ||||||
|  | destroy                   3190060 samples [reqs] | ||||||
|  | setattr                   605647 samples [reqs] | ||||||
|  | punch                     805187 samples [reqs] | ||||||
|  | sync                      6608753 samples [reqs] | ||||||
|  | preprw                    275131477 samples [reqs] | ||||||
|  | commitrw                  275131477 samples [reqs] | ||||||
|  | quotactl                  229231 samples [reqs] | ||||||
|  | ping                      78020757 samples [reqs] | ||||||
|  | ` | ||||||
|  | 
 | ||||||
|  | const osdldiskfsProcContents = `snapshot_time             1438693135.640551 secs.usecs | ||||||
|  | get_page                  275132812 samples [usec] 0 3147 1320420955 22041662259 | ||||||
|  | cache_access              19047063027 samples [pages] 1 1 19047063027 | ||||||
|  | cache_hit                 7393729777 samples [pages] 1 1 7393729777 | ||||||
|  | cache_miss                11653333250 samples [pages] 1 1 11653333250 | ||||||
|  | ` | ||||||
|  | 
 | ||||||
|  | const mdtProcContents = `snapshot_time             1438693238.20113 secs.usecs | ||||||
|  | open                      1024577037 samples [reqs] | ||||||
|  | close                     873243496 samples [reqs] | ||||||
|  | mknod                     349042 samples [reqs] | ||||||
|  | link                      445 samples [reqs] | ||||||
|  | unlink                    3549417 samples [reqs] | ||||||
|  | mkdir                     705499 samples [reqs] | ||||||
|  | rmdir                     227434 samples [reqs] | ||||||
|  | rename                    629196 samples [reqs] | ||||||
|  | getattr                   1503663097 samples [reqs] | ||||||
|  | setattr                   1898364 samples [reqs] | ||||||
|  | getxattr                  6145349681 samples [reqs] | ||||||
|  | setxattr                  83969 samples [reqs] | ||||||
|  | statfs                    2916320 samples [reqs] | ||||||
|  | sync                      434081 samples [reqs] | ||||||
|  | samedir_rename            259625 samples [reqs] | ||||||
|  | crossdir_rename           369571 samples [reqs] | ||||||
|  | ` | ||||||
|  | 
 | ||||||
|  | type metrics struct { | ||||||
|  | 	name  string | ||||||
|  | 	value uint64 | ||||||
|  | } | ||||||
|  | 
 | ||||||
|  | func TestLustre2GeneratesMetrics(t *testing.T) { | ||||||
|  | 
 | ||||||
|  | 	tempdir := os.TempDir() + "/telegraf/proc/fs/lustre/" | ||||||
|  | 	ost_name := "OST0001" | ||||||
|  | 
 | ||||||
|  | 	mdtdir := tempdir + "/mdt/" | ||||||
|  | 	err := os.MkdirAll(mdtdir+"/"+ost_name, 0755) | ||||||
|  | 	require.NoError(t, err) | ||||||
|  | 
 | ||||||
|  | 	osddir := tempdir + "/osd-ldiskfs/" | ||||||
|  | 	err = os.MkdirAll(osddir+"/"+ost_name, 0755) | ||||||
|  | 	require.NoError(t, err) | ||||||
|  | 
 | ||||||
|  | 	obddir := tempdir + "/obdfilter/" | ||||||
|  | 	err = os.MkdirAll(obddir+"/"+ost_name, 0755) | ||||||
|  | 	require.NoError(t, err) | ||||||
|  | 
 | ||||||
|  | 	err = ioutil.WriteFile(mdtdir+"/"+ost_name+"/md_stats", []byte(mdtProcContents), 0644) | ||||||
|  | 	require.NoError(t, err) | ||||||
|  | 
 | ||||||
|  | 	err = ioutil.WriteFile(osddir+"/"+ost_name+"/stats", []byte(osdldiskfsProcContents), 0644) | ||||||
|  | 	require.NoError(t, err) | ||||||
|  | 
 | ||||||
|  | 	err = ioutil.WriteFile(obddir+"/"+ost_name+"/stats", []byte(obdfilterProcContents), 0644) | ||||||
|  | 	require.NoError(t, err) | ||||||
|  | 
 | ||||||
|  | 	m := &Lustre2{ | ||||||
|  | 		Ost_procfiles: []string{obddir + "/*/stats", osddir + "/*/stats"}, | ||||||
|  | 		Mds_procfiles: []string{mdtdir + "/*/md_stats"}, | ||||||
|  | 	} | ||||||
|  | 
 | ||||||
|  | 	var acc testutil.Accumulator | ||||||
|  | 
 | ||||||
|  | 	err = m.Gather(&acc) | ||||||
|  | 	require.NoError(t, err) | ||||||
|  | 
 | ||||||
|  | 	tags := map[string]string{ | ||||||
|  | 		"name": ost_name, | ||||||
|  | 	} | ||||||
|  | 
 | ||||||
|  | 	intMetrics := []*metrics{ | ||||||
|  | 		{ | ||||||
|  | 			name:  "write_bytes", | ||||||
|  | 			value: 15201500833981, | ||||||
|  | 		}, | ||||||
|  | 		{ | ||||||
|  | 			name:  "read_bytes", | ||||||
|  | 			value: 78026117632000, | ||||||
|  | 		}, | ||||||
|  | 		{ | ||||||
|  | 			name:  "write_calls", | ||||||
|  | 			value: 71893382, | ||||||
|  | 		}, | ||||||
|  | 		{ | ||||||
|  | 			name:  "read_calls", | ||||||
|  | 			value: 203238095, | ||||||
|  | 		}, | ||||||
|  | 		{ | ||||||
|  | 			name:  "cache_hit", | ||||||
|  | 			value: 7393729777, | ||||||
|  | 		}, | ||||||
|  | 		{ | ||||||
|  | 			name:  "cache_access", | ||||||
|  | 			value: 19047063027, | ||||||
|  | 		}, | ||||||
|  | 		{ | ||||||
|  | 			name:  "cache_miss", | ||||||
|  | 			value: 11653333250, | ||||||
|  | 		}, | ||||||
|  | 	} | ||||||
|  | 
 | ||||||
|  | 	for _, metric := range intMetrics { | ||||||
|  | 		assert.True(t, acc.HasUIntValue(metric.name), metric.name) | ||||||
|  | 		assert.True(t, acc.CheckTaggedValue(metric.name, metric.value, tags)) | ||||||
|  | 	} | ||||||
|  | 
 | ||||||
|  | 	err = os.RemoveAll(os.TempDir() + "/telegraf") | ||||||
|  | 	require.NoError(t, err) | ||||||
|  | } | ||||||
		Loading…
	
		Reference in New Issue