经验首页 前端设计 程序设计 Java相关 移动开发 数据库/运维 软件/图像 大数据/云计算 其他经验
当前位置:技术经验 » 程序设计 » Docker » 查看文章
golang实现对docker容器心跳监控功能
来源:jb51  时间:2019/9/26 8:47:54  对本文有异议

自己写的go程序放到线上本来编译成二进制扔上去就行啦,但是怀着一颗docker的心,最终还是将它放到docker容器中运行起来了,运行起来也ok,一个最小容器64M,统一管理起来也方便,但是毕竟是个线上长驻内存的服务程序,万一跑挂了怎么办,如何才能监控它,直接上go代码,网上代码,略微做了下注释,但实测过,真实有效:

  1. package main
  2. import (
  3. "encoding/json"
  4. "errors"
  5. "flag"
  6. "fmt"
  7. "io/ioutil"
  8. "log"
  9. "net"
  10. "os"
  11. "strings"
  12. "time"
  13. )
  14. // 镜像结构
  15. type Image struct {
  16. Created uint64
  17. Id string
  18. ParentId string
  19. RepoTags []string
  20. Size uint64
  21. VirtualSize uint64
  22. }
  23. // 容器结构
  24. type Container struct {
  25. Id string `json:"Id"`
  26. Names []string `json:"Names"`
  27. Image string `json:"Image"`
  28. ImageID string `json:"ImageID"`
  29. Command string `json:"Command"`
  30. Created uint64 `json:"Created"`
  31. State string `json:"State"`
  32. Status string `json:"Status"`
  33. Ports []Port `json:"Ports"`
  34. Labels map[string]string `json:"Labels"`
  35. HostConfig map[string]string `json:"HostConfig"`
  36. NetworkSettings map[string]interface{} `json:"NetworkSettings"`
  37. Mounts []Mount `json:"Mounts"`
  38. }
  39. // docker 端口映射
  40. type Port struct {
  41. IP string `json:"IP"`
  42. PrivatePort int `json:"PrivatePort"`
  43. PublicPort int `json:"PublicPort"`
  44. Type string `json:"Type"`
  45. }
  46. // docker 挂载
  47. type Mount struct {
  48. Type string `json:"Type"`
  49. Source string `json:"Source"`
  50. Destination string `json:"Destination"`
  51. Mode string `json:"Mode"`
  52. RW bool `json:"RW"`
  53. Propatation string `json:"Propagation"`
  54. }
  55. // 连接列表
  56. var SockAddr = "/var/run//docker.sock" //这可不是随便写的,是docker官网文档的套接字默认值,当然守护进程通讯方式还有tcp,fd等方式,各自都有适用场景。。。
  57. var imagesSock = "GET /images/json HTTP/1.0\r\n\r\n" //docker对外的镜像api操作
  58. var containerSock = "GET /containers/json?all=true HTTP/1.0\r\n\r\n" //docker对外的容器查看api
  59. var startContainerSock = "POST /containers/%s/start HTTP/1.0\r\n\r\n" //docker对外的容器启动api
  60. // 白名单
  61. var whiteList []string
  62. func main() {
  63. // 读取命令行参数
  64. // 白名单列表
  65. list := flag.String("list", "", "docker white list to restart, eg: token,explorer")
  66. // 轮询的时间间隔,单位秒
  67. times := flag.Int64("time", 10, "time interval to set read docker containers [second], default is 10 second")
  68. flag.Parse()
  69. // 解析list => whiteList
  70. whiteList = strings.Split(*list, ",") //将我们命令行中list参数的容器列表解析到代码中
  71. log.SetOutput(os.Stdout)
  72. log.Println("start docker watching...")
  73. log.Printf("Your whiteList: %v\n", *list)
  74. log.Printf("Your shedule times: %ds\n", *times)
  75. //接下来的这个for循环就是每隔一定时间监控docker容器是否正常运行,不正常就重新启动它
  76. for {
  77. // 轮询docker
  78. err := listenDocker()
  79. if err != nil {
  80. log.Println(err.Error())
  81. }
  82. time.Sleep(time.Duration(*times)*time.Second)
  83. }
  84. }
  85. func listenDocker() error {
  86. // 获取容器列表,拿到所有的容器信息
  87. containers, err := readContainer()
  88. if err != nil {
  89. return errors.New("read container error: " + err.Error())
  90. }
  91. // 先遍历白名单快,次数少
  92. for _, name := range whiteList {
  93. Name:
  94. for _, container := range containers {
  95. for _, cname := range container.Names {
  96. // 如果匹配到白名单
  97. if cname[1:] == name {
  98. // 关心一下容器状态
  99. log.Printf("id=%s, name=%s, state=%s", container.Id[:12], container.Names, container.Status)
  100. if strings.Contains(container.Status, "Exited") {
  101. // 如果出现异常退出的容器,启动它
  102. log.Printf("find container: [%s] has exited, ready to start it. ", name)
  103. e := startContainer(container.Id)
  104. if e != nil {
  105. log.Println("start container error: ", e.Error())
  106. }
  107. break Name
  108. }
  109. }
  110. }
  111. }
  112. }
  113. return nil
  114. }
  115. // 获取 unix sock 连接
  116. func connectDocker() (*net.UnixConn, error) {
  117. addr := net.UnixAddr{SockAddr, "unix"} // SockAddr 这个变量的值被设定为docker的/var/run/docker 套接字路径值,也就是说此处就是拨通与docker的daemon通讯建立的关键处,其他处的代码就是些正常的逻辑处理了
  118. return net.DialUnix("unix", nil, &addr)
  119. }
  120. // 启动容器
  121. func startContainer(id string) error {
  122. conn, err := connectDocker()
  123. if err != nil {
  124. return errors.New("connect error: " + err.Error())
  125. }
  126. start := fmt.Sprintf(startContainerSock, id)
  127. fmt.Println(start)
  128. cmd := []byte(start)
  129. code, err := conn.Write(cmd)
  130. if err != nil {
  131. return err
  132. }
  133. log.Println("start container response code: ", code)
  134. // 启动容器等待20秒,防止数据重发
  135. time.Sleep(20*time.Second)
  136. return nil
  137. }
  138. // 获取容器列表
  139. func readContainer() ([]Container, error) {
  140. conn, err := connectDocker() //建立一个unix连接,这其实是一个关键点,需要你了解unix 套接字 建立连接
  141. if err != nil {
  142. return nil, errors.New("connect error: " + err.Error())
  143. }
  144. _, err = conn.Write([]byte(containerSock))
  145. if err != nil {
  146. return nil, err
  147. }
  148. result, err := ioutil.ReadAll(conn)
  149. if err != nil {
  150. return nil, err
  151. }
  152. body := getBody(result)
  153. var containers []Container
  154. err = json.Unmarshal(body, &containers)
  155. if err != nil {
  156. return nil, err
  157. }
  158. log.Println("len of containers: ", len(containers))
  159. if len(containers) == 0 {
  160. return nil, errors.New("no containers")
  161. }
  162. return containers, nil
  163. }
  164. // 获取镜像列表
  165. func readImage(conn *net.UnixConn) ([]Image, error) {
  166. _, err := conn.Write([]byte(imagesSock))
  167. if err != nil {
  168. return nil, err
  169. }
  170. result, err := ioutil.ReadAll(conn)
  171. if err != nil {
  172. return nil, err
  173. }
  174. body := getBody(result[:])
  175. var images []Image
  176. err = json.Unmarshal(body, &images)
  177. if err != nil {
  178. return nil, err
  179. }
  180. return images, nil
  181. }
  182. // 从返回的 http 响应中提取 body
  183. func getBody(result []byte) (body []byte) {
  184. for i:=0; i<=len(result)-4; i++ {
  185. if result[i] == 13 && result[i+1] == 10 && result[i+2] == 13 && result[i+3] == 10 {
  186. body = result[i+4:]
  187. break
  188. }
  189. }
  190. return
  191. }
  192. /*
  193. error log :
  194. 1、write unix @->/var/run/docker.sock: write: broken pipe
  195. 建立的tcp连接不能复用,每次操作都建立连接
  196. */

使用方法

1.编译

go build -o main main.go

2.linux下直接当可执行文件执行便可

./main -list="容器名称1,容器名称2..."

思路分析:

原来docker这个软件对外是提供了一些列api用来管理容器的增删该查的 官方api文档 ,既然提供了api了那么任何语言都能实现对其的管理控制及动态部署了。

但其实这里面真要弄明白还是有很多话要讲了

docker这个服务已经已进程的形式运行在linux的系统中了,为什么我们输入docker有关的命令能够与之交互,这好像是一个习以为常的行为,貌似理应如此,但是要知道我们是在与一个正在运行的进程发生通讯,若仍不以为然,请接以下问:

1.进程间都是如何通讯的? 进程通讯间方式

在明白了进程之间的通讯方式之后,我明白了docker的这个daemon通讯原理,瞬间就打通了之前对k8管理docker的疑惑(老实讲只知道kubernetes很强大,却没想明白它是如何能动态增容我的容器配置,负载等等等),套接字(socket) /var/run/docker 这个我们使用起来不会接触到,理解起来却必须打通的关键点请务必了解它。

总结

以上所述是小编给大家介绍的golang实现对docker容器心跳监控功能,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对w3xue网站的支持!
如果你觉得本文对你有帮助,欢迎转载,烦请注明出处,谢谢!

 友情链接:直通硅谷  点职佳  北美留学生论坛

本站QQ群:前端 618073944 | Java 606181507 | Python 626812652 | C/C++ 612253063 | 微信 634508462 | 苹果 692586424 | C#/.net 182808419 | PHP 305140648 | 运维 608723728

W3xue 的所有内容仅供测试,对任何法律问题及风险不承担任何责任。通过使用本站内容随之而来的风险与本站无关。
关于我们  |  意见建议  |  捐助我们  |  报错有奖  |  广告合作、友情链接(目前9元/月)请联系QQ:27243702 沸活量
皖ICP备17017327号-2 皖公网安备34020702000426号