上图 王驰(立)与同事分析遥感卫星数据。
左图 大地量子生成的吉林省榆树市玉米分布图。
下图 王驰(左)在农田里实地勘验农作物种植面积与产量。
身在北京,大地量子公司凭借自主研发的AI+卫星遥感分析技术,可以准确预估吉林大豆每亩的产量,哪怕这些作物仍在生长中。更有意思的是,它们还能判断柑橘树的种植面积、产量,以及柑橘树已经种了几年——
北京距离吉林大约900多公里。然而,就在北京望京的一间办公室里,大地量子创始人兼CEO王驰却肯定地说:“我们能算出吉林大豆每亩的产量。”
不只是大豆,玉米、棉花等全球常见的作物,远在千万里之外的大地量子都能计算出它们一天之前的种植面积,并准确预估其产量——哪怕这些作物仍在生长中,连种植它们的农民都不一定说得清几个月后自己的收获。
更有意思的是,它们还能判断柑橘树的种植面积、产量,以及柑橘树已经种了几年。
大地量子没有魔法。它们能“监控”全球农作物的“前世今生”,靠的是自主研发的AI+卫星遥感分析技术。
来自“数字地球”的创业灵感
遥感卫星不是新鲜事物,大众熟悉的谷歌地图中就有部分遥感卫星应用。经常有人在谷歌街景中找到自己的房子、汽车。
而对于分析遥感卫星信息的专业人士来说,谷歌地图那种肉眼可见的图片被称为“可见光”信息,只能提供最基础的信息,让消费者看到一张图片。专业分析则需要更多“不可见光”信息,比如近红外、远红外、短波红外、热红外,还包括信息的强弱和时空分布记录。通过这些信息,AI可以识别建筑物、农作物、林地、河流等,开展违章建筑的排查、农作物种植面积计算、国土面积计算等。
根据美国忧思科学家联盟(UCS)数据,截至2018年4月,全球遥感卫星数量达到684颗。中国也有高分一号、高分二号、资源三号等国产高分辨率遥感卫星。这些民用遥感卫星传回的数据基本都有公开或商业渠道。也就是说,全球的卫星遥感分析公司拿到的数据都是基本一致的,没有独家数据。谁能够从公开的卫星数据里提取加工出有价值的独家信息,谁就能站稳市场。
不过,起初王驰并没有想过要跟天上的卫星打交道。从上海交通大学电子计算机专业毕业后,他又取得了美国南加州大学量子计算方向博士学位。2016年的某一天,他突发灵感,想通过各种数据生成一个数字地球。当他向已有渠道寻找信息时,却发现无法获得想要的信息——要么信息不准确,要么只能提供一堆散乱的卫星数据,没有意义。
这成了王驰创业的灵感来源,并于2017年成立了大地量子公司,带领团队致力于打造基于3S和AI技术的时空大数据平台。
搭上国家卫星技术发展快车
王驰的创业恰逢我国卫星技术的爆发期。1988年我国第一颗气象卫星风云一号成功升空,2017年风云四号正式交付用户投入使用,中国追上了气象卫星的国际先进水平;2003年,我国造出北斗一代导航卫星,到2017年,已经成功发射了20多颗北斗卫星;2016年,我国的墨子号量子科学实验卫星成功发射升空,其量子通信技术至今领先全球;2015年,我国的高分八号卫星成功发射升空,2016年,高分应用综合信息服务共享平台上线运行,可为国内及国际等各类用户提供在线服务。
据不完全统计,截至2017年,我国在轨卫星数量已经达到了192颗,占全球的13%,仅次于美国。这极大助力了大地量子的起步发展。
“高分卫星的数据可以免费使用,数据质量在某些领域已经超过欧美。”王驰说,高分卫星的空间分辨率为全色2米、多光谱优于8米,单星成像幅宽大于60公里。3星组网并投入运行后,可实现同一地区2天重访,15天以内对全球覆盖一遍,获取规模化的1∶2.5万至1∶5万自然资源信息,山、水、林、田、湖、草等自然资源全要素都能覆盖。
“目前,大地量子通过开源、协议获取、商业购买等渠道,基本可以获取所需的全部信息。”王驰说,“尤其是高分卫星等提供的免费信息,让公司可以将资金主要投入AI技术开发,降低运营成本。”
获取数据不是门槛,大地量子的核心竞争力必然是数据处理。用王驰的话说,用户不需要知道自己需要什么数据、怎么获取、怎么加工,他们只需要提出需求,大地量子就能告诉他们答案。
简单的理念背后,处处需要技术突破。首先遇到的难题就是——卫星数据量极大。在一个文件夹里寻找存储的信息,可能仅需几分钟,但如果这个文件夹里有上千个文件,找起来就费劲了。而卫星数据大到难以想象。“我们粗略分析全美农田需要的数据就有1PB,如果是家用宽带,要持续下载3年。”王驰说,“过大的数据量,让原本不是问题的事情也变成了问题。”
为了解决这个问题,大地量子重构了文件储存、搜索系统,使得数据检索和处理效率有了质的提升。也就是说,提升更大的并不完全是效率,而是精度。王驰解释说:“比如,以前面试过程中我要预判一个人的能力,可能只能和他聊聊;而现在,我可以调出这人所有的考试成绩、所有写过的代码、来自同事的评价,通过算法自动的判断不仅更快,而且更准。其中的技术问题就在于这些非标的历史数据如何存为一种标准格式,来让写算法这件事成为可能,这就是我们在处理多种空间数据时遇到的数据融合问题,能够用到的数据种类越多,预判就越准确。”
找到了需要的信息文件,大地量子利用云计算,用AI训练机器识别卫星传回的信息。在解决了所有问题之后,大地量子就像有了星际翻译机,可以把卫星的语言翻译成人类语言,借助卫星看到的山、林、湖、海,讲述地球人听得懂的故事。
应用前景越来越广阔
攻克技术难题后,大地量子很快接到了一个项目委托,要预测吉林的大豆产量。“我们总体上进行了两项工作。首先是在吉林广阔的农业种植区中,对大豆种植区域进行提取,也就是通常所说的作物识别,然后是在种植季中期对大豆产量开展预测。”王驰解释说,为了对大豆进行识别,大地量子对种植区内近10年的卫星影像和地理信息进行了处理,最终在几天内完成了像素级的大豆种植区域提取。
在大豆识别的基础上,大地量子结合吉林大豆历史产量和气象数据,利用深度学习模型,在种植季中期对大豆产量开展预测。而传统产量预测,就算最有经验的农场主也只能在临近收获时才能进行。
这两部分工作都涉及巨大的数据量和计算量,但大地量子自主研发的数据处理系统能够显著加快运算效率,与传统方法相比,运算速度提升80%至90%。而根据委托客户的实际验证,大地量子的速算结果与实际吻合。
“我们结合使用多个卫星数据,综合下来能按照一天两次的频率收集一个地区的信息。”王驰说,最近大地量子又跟华为云达成了合作,计算能力大幅提升,仅需24小时就能完成计算。因此,只要有需求,大地量子可以准确计算出前一天吉林大豆、玉米、棉花等各种农作物的产量。
通过迁移学习,这套技术也能够用于其他任何地区。“我们训练过机器识别玉米、大豆、水稻、柑橘、棉花,目前可以覆盖我国东北、华北地区。”王驰说。为验证结果,他们还会派人到实地勘察,无论是勘察结果还是客户反馈,结果误差都在5%左右。对于生长条件变化多端的农作物来说,这个准确率已经相当高了。
农资公司、保险公司和期货公司很快发现了这中间的生意经。“如农化领域的巨头科迪华农业科技公司(Corteva Agriscience),希望整合卫星遥感技术更好地服务于目标种植户。他们找到大地量子,搜索为目标客户提供精准营销的方法。”王驰解释说,“这个应用是我们先识别这种农作物,再搜索计算,看这个地块上何时出现了这种农作物。找到了出生日期,就能判断生长年限。”
人保北京分公司也成了大地量子的客户。公司农村保险/扶贫保险事业部副总经理郭治军告诉记者,以前理赔需要勘验人员上门核查,并邀请农业专家参与,才能确定受灾损失。而与大地量子合作后,定损流程大幅缩短。“去年9月,黑龙江有一位客户对理赔存有异议,我们就委托大地量子开展定损。”郭治军表示,卫星定损的结果与之前的人工勘验基本吻合。
“这是人保北京公司第一次利用卫星定损,效果很好,公司上下都很关注。”郭治军说,下一步双方将在北京承保区继续磨合,将来卫星定损会成为农险查勘定损的标配环节,在公司全面推广。