麦收大忙时节,在金色的田野里,一辆辆收割机忙碌作业,在中国农业大学信电楼,北斗团队10多名师生也在日夜奋战。团队每日发布的“麦收快讯”成为今年“三夏”机手们手中的“利器”。“麦收快讯”主要通过“精准农业技术装备分会”微信公众号发布,首次集成了国内主流小麦收割机制造企业的北斗定位数据,在国际上也是首次实现国家级大范围农机数据共享和大数据应用服务。发布内容主要包括“中国小麦收割作业热点图”“中国小麦收割作业每日进度动图”“中国小麦收割作业效率图”等。
“结合热点图,机手可以更加及时、全面地掌握各地麦熟日期和农机分布等信息,做到眼观六路、耳听八方,眼中有图、心中不慌。每日发布的‘快讯’中都有我们的联系方式,麦收结束后,机手可以向团队索要作业轨迹、面积报表,总结经验与得失,改进下一年度的跨区路线和计划。”中国农业大学信息与电气工程学院北斗团队牵头人、中国农机工业协会精准农业技术装备分会秘书长吴才聪告诉记者。
北斗团队的“十二时辰”
北斗团队办公室里的紧张与忙碌程度一点不逊色于麦收“战场”。团队每天18∶00点启动大数据自动挖掘程序,23∶00前后完成数据分析和报告生成,经吴才聪最终审核后,于次日8∶00发布。为确保数据准确无误,团队每天21∶00举行全体组员参加的调度会,交叉审核各项数据的真实性与合理性。之后,还要随机抽取100辆收割机,人工统计作业面积,与算法获得的作业面积进行比对,不断优化算法参数。
海量数据是如何获取的呢?“‘麦收快讯’的数据来源于农机制造企业在收割机上安装的北斗终端。在‘北斗精准农业应用’国家重大项目的支持下,潍柴雷沃重工股份有限公司、江苏沃得农业机械有限公司、中联农业机械股份有限公司和中国一拖集团有限公司等农机制造企业在收割机出厂前安装了北斗远程运维终端。”吴才聪告诉记者,今年麦收高峰期,单天最多有2.37万辆收割机上报了数据,约占全国小麦收割机总量的10%。
数据又是如何形成报告的呢?“收割机工作时,北斗终端实时采集收割机的位置与工况数据,通过SIM卡回传至企业数据平台;企业平台将数据实时转发至中国农业大学建设的国家农机作业大数据中心,北斗团队据此挖掘数据,形成‘麦收快讯’分析报告。”吴才聪说。
谈及发布“麦收快讯”的初衷,吴才聪表示,小麦跨区机收是典型的农机社会化服务,“三夏”期间,数十万台收割机“南征北战”,对我国粮食颗粒归仓起到了重大作用。但二十余年来,因缺乏相应技术手段,有关部门还无法全面、准确和及时地掌握收割机时空分布和麦收进度,难以为机手提供高质量的信息和保障服务。因此,农机制造企业的“三包”服务和收割机机手的跨区转移存在较大的盲目性和不确定性。“跨区机收意义重大,但指导手段相对落后、无序流动严重、存在一定浪费。”吴才聪说,“麦收快讯”通过运用北斗时空大数据,试图从宏观、中观和微观层面,服务农业农村部门、农机制造企业、农机合作社和收割机机手,以全面把握麦收热点、麦收进度、跨区方向,提升全国麦收效率,降低行业共性成本,减少农机尾气排放。
“利器”何“利”之有
“‘麦收快讯’作为大数据中心首次推出的大数据专题应用,今年能够成功发布,离不开全行业的支持和帮助。国家农机作业大数据的建设是几代农机人孜孜以求的梦想,是在我国自主建设的北斗卫星导航系统开启全球服务的背景下,农业农村部、财政部和国家发改委等多部委联合支持下建设的具有非凡意义的重大成果。”吴才聪十分感慨,首先,中国农业大学根据农机作业大数据的应用场景,设计和构建了大数据构架,实现了大数据接入、清洗、存储、处理与发布的一条龙服务。其次,农业农村部农业机械化总站整体调度农机制造企业,在数据传输协议、项目调度等方面保障数据传输。最后,中国农业大学北斗团队研发了高效精确的大数据挖掘算法,可自动提取收割机的作业时长、作业里程和作业面积等数据。
“‘麦收快讯’是为跨区机手、农机企业和农业农村部门量身定制的。”吴才聪说,在麦收期间,基于作业热点图,机手可以更加精确地判断跨区的时机和距离;农机企业可以围绕热点区域提供精准的“三包”服务;农业农村部门可以提供及时有效的交通疏导和应急保障等服务。麦收结束后,经深度挖掘,还可以量化评价我国农机分布均衡性、农机利用率和农机作业效益,揭示我国农机社会化服务的现状、特征和问题,为我国农机购置补贴和农机作业补贴等政策的优化提供决策参考。
谈及数据的代表性,吴才聪表示,“麦收快讯”虽然获取的农机数量有限,但在整体规律和趋势的把握上,具有小数据或人工调查无法比拟的优势。今年发布的“麦收快讯”涵盖了河南、山东、河北、安徽、江苏、湖北6个小麦主产省,涉及5-10公斤/秒喂入量的各类机型共139个。“‘麦收快讯’的覆盖范围取决于近两年收割机的销售分布,但更主要的是取决于机手的跨区意愿和行为。”吴才聪指出,由于上线农机数量多于经典抽样统计所需的样本量,因此“麦收快讯”具有坚实的科学依据。此外,从农业农村部门、农机企业、收割机机手和相关单位与个人的反映来看,热点图能够真实地反应小麦收割机的分布和作业情况。
北斗,明天更美好
“在我国,农机作业大数据的应用刚刚起步。此次‘麦收快讯’小试牛刀,即已显现出大数据的作用和意义。”吴才聪十分欣慰,但相比小数据而言,大数据的开发利用不仅仅是数据量更大了,更关键的是高性能服务器的算力和大数据挖掘的算法要跟上,特别是需要一支稳定的专业队伍,能够围绕农机作业主要环节开发相应的算法和模型,向各级部门提供持续的大数据分析服务。
“数据的稳定获取是团队目前面临的最大挑战。”吴才聪坦言,数据获取是有成本的,如何让数据提供者获得应有的回报,需要团队深入思考和面对。“我们初步考虑成立数据提供者联盟,分享数据存储资源、算力资源和挖掘模型,降低行业共性成本,形成行业合力,构建可持续发展的农机作业大数据生态。”
“未来,我们将针对机手、农机合作社、农机制造企业及农业农村部门的应用需求,汇聚农田分布、作物分布、农机分布、天气云图、机收价格等信息,形成综合性、实时性与公益性的农机作业大数据平台。”吴才聪说,当然,平台不会包罗万象,而是定位于数据的汇聚与分享,为行业提供基础数据产品和分析报告。此外,还将根据有关各方的应用需求和数据的可获得性,采取先急后缓、先易后难、分步实施的原则,开展专题性的大数据挖掘与分析。目前已列入计划的是“稻收快讯”“玉收快讯”。
最后,吴才聪建议道,要深刻认识到大数据应用的复杂性和艰巨性,要准确把握大数据获取、管理、处理与利用的基本规律,切实将农机手、农机合作社与农机制造企业的利益放到第一位,让有关各方主动分享数据和获得良好收益,形成健康持续的农机作业大数据生态。