zolfa
/
tendermint

package monitor
import (	"fmt"	"math/rand"	"time"
	"github.com/go-kit/kit/log"	"github.com/pkg/errors"	tmtypes "github.com/tendermint/tendermint/types")
// waiting more than this many seconds for a block means we're unhealthy
const nodeLivenessTimeout = 5 * time.Second
// Monitor keeps track of the nodes and updates common statistics upon
// receiving new events from nodes.
//
// Common statistics is stored in Network struct.
type Monitor struct {	Nodes   map[string]*Node	Network *Network
	monitorQuit chan struct{}            // monitor exitting
	nodeQuit    map[string]chan struct{} // node is being stopped and removed from under the monitor

	recalculateNetworkUptimeEvery time.Duration	numValidatorsUpdateInterval   time.Duration
	logger log.Logger}
// NewMonitor creates new instance of a Monitor. You can provide options to
// change some default values.
//
// Example:
//   NewMonitor(monitor.SetNumValidatorsUpdateInterval(1 * time.Second))
func NewMonitor(options ...func(*Monitor)) *Monitor {	m := &Monitor{		Nodes:                         make(map[string]*Node),		Network:                       NewNetwork(),		monitorQuit:                   make(chan struct{}),		nodeQuit:                      make(map[string]chan struct{}),		recalculateNetworkUptimeEvery: 10 * time.Second,		numValidatorsUpdateInterval:   5 * time.Second,		logger: log.NewNopLogger(),	}
	for _, option := range options {		option(m)	}
	return m}
// RecalculateNetworkUptimeEvery lets you change network uptime update interval.
func RecalculateNetworkUptimeEvery(d time.Duration) func(m *Monitor) {	return func(m *Monitor) {		m.recalculateNetworkUptimeEvery = d	}}
// SetNumValidatorsUpdateInterval lets you change num validators update interval.
func SetNumValidatorsUpdateInterval(d time.Duration) func(m *Monitor) {	return func(m *Monitor) {		m.numValidatorsUpdateInterval = d	}}
// SetLogger lets you set your own logger
func (m *Monitor) SetLogger(l log.Logger) {	m.logger = l}
// Monitor begins to monitor the node `n`. The node will be started and added
// to the monitor.
func (m *Monitor) Monitor(n *Node) error {	m.Nodes[n.Name] = n
	blockCh := make(chan tmtypes.Header, 10)	n.SendBlocksTo(blockCh)	blockLatencyCh := make(chan float64, 10)	n.SendBlockLatenciesTo(blockLatencyCh)	disconnectCh := make(chan bool, 10)	n.NotifyAboutDisconnects(disconnectCh)
	if err := n.Start(); err != nil {		return err	}
	m.Network.NewNode(n.Name)
	m.nodeQuit[n.Name] = make(chan struct{})	go m.listen(n.Name, blockCh, blockLatencyCh, disconnectCh, m.nodeQuit[n.Name])
	return nil}
// Unmonitor stops monitoring node `n`. The node will be stopped and removed
// from the monitor.
func (m *Monitor) Unmonitor(n *Node) {	m.Network.NodeDeleted(n.Name)
	n.Stop()	close(m.nodeQuit[n.Name])	delete(m.nodeQuit, n.Name)	delete(m.Nodes, n.Name)}
// Start starts the monitor's routines: recalculating network uptime and
// updating number of validators.
func (m *Monitor) Start() error {	go m.recalculateNetworkUptimeLoop()	go m.updateNumValidatorLoop()
	return nil}
// Stop stops the monitor's routines.
func (m *Monitor) Stop() {	close(m.monitorQuit)
	for _, n := range m.Nodes {		m.Unmonitor(n)	}}
// main loop where we listen for events from the node
func (m *Monitor) listen(nodeName string, blockCh <-chan tmtypes.Header, blockLatencyCh <-chan float64, disconnectCh <-chan bool, quit <-chan struct{}) {	logger := log.With(m.logger, "node", nodeName)
	for {		select {		case <-quit:			return		case b := <-blockCh:			m.Network.NewBlock(b)			m.Network.NodeIsOnline(nodeName)		case l := <-blockLatencyCh:			m.Network.NewBlockLatency(l)			m.Network.NodeIsOnline(nodeName)		case disconnected := <-disconnectCh:			if disconnected {				m.Network.NodeIsDown(nodeName)			} else {				m.Network.NodeIsOnline(nodeName)			}		case <-time.After(nodeLivenessTimeout):			logger.Log("event", fmt.Sprintf("node was not responding for %v", nodeLivenessTimeout))			m.Network.NodeIsDown(nodeName)		}	}}
// recalculateNetworkUptimeLoop every N seconds.
func (m *Monitor) recalculateNetworkUptimeLoop() {	for {		select {		case <-m.monitorQuit:			return		case <-time.After(m.recalculateNetworkUptimeEvery):			m.Network.RecalculateUptime()		}	}}
// updateNumValidatorLoop sends a request to a random node once every N seconds,
// which in turn makes an RPC call to get the latest validators.
func (m *Monitor) updateNumValidatorLoop() {	rand.Seed(time.Now().Unix())
	var height uint64	var num int	var err error
	for {		if 0 == len(m.Nodes) {			time.Sleep(m.numValidatorsUpdateInterval)			continue		}
		randomNodeIndex := rand.Intn(len(m.Nodes))
		select {		case <-m.monitorQuit:			return		case <-time.After(m.numValidatorsUpdateInterval):			i := 0			for _, n := range m.Nodes {				if i == randomNodeIndex {					height, num, err = n.NumValidators()					if err != nil {						m.logger.Log("err", errors.Wrap(err, "update num validators failed"))					}					break				}				i++			}
			if m.Network.Height <= height {				m.Network.NumValidators = num			}		}	}}