经验首页 前端设计 程序设计 Java相关 移动开发 数据库/运维 软件/图像 大数据/云计算 其他经验
当前位置:技术经验 » 数据库/运维 » MySQL » 查看文章
地理位置geo处理之mysql函数
来源:cnblogs  作者:GO麦田麦穗  时间:2021/3/24 9:03:37  对本文有异议

目前越来越多的业务都会基于LBS,附近的人,外卖位置,附近商家等等,现就讨论离我最近这一业务场景的解决方案。

目前已知解决方案有:

  • mysql 自定义函数计算
  • mysql geo索引
  • mongodb geo索引
  • postgresql PostGis索引
  • redis geo
  • ElasticSearch

本文测试下mysql 函数运算的性能

准备工作

创建数据表

  1. CREATE TABLE `driver` (
  2. `id` int(11) unsigned NOT NULL AUTO_INCREMENT,
  3. `lng` float DEFAULT NULL,
  4. `lat` float DEFAULT NULL,
  5. PRIMARY KEY (`id`)
  6. ) ENGINE=InnoDB DEFAULT CHARSET=utf8;

创建测试数据

在创建数据之前先了解下基本的地理知识:

  • 全球经纬度的取值范围为: 纬度-9090,经度-180180

  • 中国的经纬度范围大约为: 纬度3.8653.55,经度73.66135.05

  • 北京行政中心的纬度为39.92,经度为116.46

  • 越北面的地方纬度数值越大,越东面的地方经度数值越大

  • 度分转换: 将度分单位数据转换为度单位数据,公式:度=度+分/60

  • 分秒转换: 将度分秒单位数据转换为度单位数据,公式:度 = 度 + 分 / 60 + 秒 / 60 / 60

在纬度相等的情况下:

  • 经度每隔0.00001度,距离相差约1米

在经度相等的情况下:

  • 纬度每隔0.00001度,距离相差约1.1米

mysql函数计算

  1. DELIMITER //
  2. CREATE DEFINER=`root`@`localhost` FUNCTION `getDistance`(
  3. `lng1` float(10,7)
  4. ,
  5. `lat1` float(10,7)
  6. ,
  7. `lng2` float(10,7)
  8. ,
  9. `lat2` float(10,7)
  10. ) RETURNS double
  11. COMMENT '计算2坐标点距离'
  12. BEGIN
  13. declare d double;
  14. declare radius int;
  15. set radius = 6371000; #假设地球为正球形,直径为6371000米
  16. set d = (2*ATAN2(SQRT(SIN((lat1-lat2)*PI()/180/2)
  17. *SIN((lat1-lat2)*PI()/180/2)+
  18. COS(lat2*PI()/180)*COS(lat1*PI()/180)
  19. *SIN((lng1-lng2)*PI()/180/2)
  20. *SIN((lng1-lng2)*PI()/180/2)),
  21. SQRT(1-SIN((lat1-lat2)*PI()/180/2)
  22. *SIN((lat1-lat2)*PI()/180/2)
  23. +COS(lat2*PI()/180)*COS(lat1*PI()/180)
  24. *SIN((lng1-lng2)*PI()/180/2)
  25. *SIN((lng1-lng2)*PI()/180/2))))*radius;
  26. return d;
  27. END//
  28. DELIMITER ;

创建数据python脚本

  1. # coding=utf-8
  2. from orator import DatabaseManager, Model
  3. import logging
  4. import random
  5. import threading
  6. """ 中国的经纬度范围 纬度3.86~53.55,经度73.66~135.05。大概0.00001度差距1米 """
  7. # 创建 日志 对象
  8. logger = logging.getLogger()
  9. handler = logging.StreamHandler()
  10. formatter = logging.Formatter(
  11. '%(asctime)s %(name)-12s %(levelname)-8s %(message)s')
  12. handler.setFormatter(formatter)
  13. logger.addHandler(handler)
  14. logger.setLevel(logging.DEBUG)
  15. # Connect to the database
  16. config = {
  17. 'mysql': {
  18. 'driver': 'mysql',
  19. 'host': 'localhost',
  20. 'database': 'dbtest',
  21. 'user': 'root',
  22. 'password': '',
  23. 'prefix': ''
  24. }
  25. }
  26. db = DatabaseManager(config)
  27. Model.set_connection_resolver(db)
  28. class Driver(Model):
  29. __table__ = 'driver'
  30. __timestamps__ = False
  31. pass
  32. def ins_driver(thread_name,nums):
  33. logger.info('开启线程%s' % thread_name)
  34. for _ in range(nums):
  35. lng = '%.5f' % random.uniform(73.66, 135.05)
  36. lat = '%.5f' % random.uniform(3.86, 53.55)
  37. driver = Driver()
  38. driver.lng = lng
  39. driver.lat = lat
  40. driver.save()
  41. thread_nums = 10
  42. for i in range(thread_nums):
  43. t = threading.Thread(target=ins_driver, args=(i, 400000))
  44. t.start()

image.png

以上脚本创建10个线程,10个线程插入4万条数据。耗费150.18s执行完,总共插入40万条数据

测试

  • 测试环境

系统:mac os

内存:16G

cpu: intel core i5

硬盘: 500g 固态硬盘

测试下查找距离(134.38753,18.56734)这个坐标点最近的10个司机

  1. select *,`getDistance`(134.38753,18.56734,`lng`,`lat`) as dis from driver ORDER BY dis limit 10
  • 耗时:18.0s
  • explain:全表扫描

我测试了从1万到10万间隔1万和从10万到90万每间隔10万测试的结果变化

image.png

结论

  • 此方案在数据量达到3万条查询耗时就会超过1秒
  • 大约每增加1万条就会增加0.4秒的耗时

原文链接:http://www.cnblogs.com/maitian2013/p/14512147.html

 友情链接:直通硅谷  点职佳  北美留学生论坛

本站QQ群:前端 618073944 | Java 606181507 | Python 626812652 | C/C++ 612253063 | 微信 634508462 | 苹果 692586424 | C#/.net 182808419 | PHP 305140648 | 运维 608723728

W3xue 的所有内容仅供测试,对任何法律问题及风险不承担任何责任。通过使用本站内容随之而来的风险与本站无关。
关于我们  |  意见建议  |  捐助我们  |  报错有奖  |  广告合作、友情链接(目前9元/月)请联系QQ:27243702 沸活量
皖ICP备17017327号-2 皖公网安备34020702000426号