出发去贵州前一周,周南书在家里整理资料。
李建明来了,带着他的笔记本电脑。两个人坐在槐树底下,周南书翻笔记本,李建明往电脑里录入数据——洛桑县的三十七个点位,每个点位的观察记录、判断依据、复核结果。
录入到第十七个点位的时候,李建明停了一下。
“师父,您这些记录,我越录越觉得乱。”
“哪里乱?”
“格式不统一。这个点位写了山脊走向,下一个点位没写。这个写了植被密度,那个写了鼠洞朝向。要是想用电脑分析,根本没法批量处理。”
周南书看了看自己的笔记本,承认他说得对。她的记录方式是跟着感觉走的,到了现场看到什么记什么,没有固定格式。对人工阅读来说没问题,对电脑来说就是一团乱麻。
“你有办法统一吗?”
“办法有,但麻烦。”李建明调出一个Excel表格,“您看,我把您洛桑县的三十七个点位的所有观察项都列出来了——山脊走向、河谷形态、植被密度、岩石风化、地下水位、动物痕迹、土壤颜色、坡度坡向、水系距离,一共九项。但每个点位只记录了其中四到六项,不全。”
“不全怎么办?”
“要么补,要么空着。机器学习的话,空值太多会影响模型质量。”
周南书端起茶杯喝了一口。茶凉了,她没在意。
“你说的机器学习,现在做的人多吗?”
“多。但国内起步晚。”李建明把电脑转过来给她看,“您看这篇论文,是去年发表的,讲的是用神经网络识别滑坡易发区。数据用的是国外的,国内的还没人做出来。不是说技术不行,是国内的野外数据太少了。像洛桑县这种高精度、逐点验证的数据,全国找不出第二份。”
周南书看着屏幕上密密麻麻的英文和图表,没看太懂。
“你的意思是,我的数据比别人的好?”
“不是好,是稀缺。您这三十七个点,每一个都有现场观察记录、有地质队复核结果、有准确坐标。这种数据,搞机器学习的人做梦都想要。”
周南书没说话。
福崽从窗台上跳下来,走到桌边,低头看了看电脑屏幕。它当然看不懂,但它知道李建明说得很认真。
“你那个徒弟,又开始说一些我听不懂的话了。”福崽喵了一声。
周南书没理它。
李建明继续录入数据,周南书在旁边看。看了半个多小时,她发现一个问题。
“你这个Excel表格,只能记录我写下来的东西。但我写下来的只是我观察到的一部分。比如山脊走向,我在笔记本上只写了‘北东走向’,但我在现场是站在山脊上来回走了两趟、对比了两侧的山谷深度之后才确认的。这个过程没有记下来。”
李建明停下来,抬起头:“师父,您的意思是,我漏了判断过程?”
“不是漏。是记不下来。判断过程在我脑子里,写不到纸上。电脑更不可能理解。”
李建明沉默了一会儿,点了点头。
“所以专家系统很难做。经验的东西,电脑学不会。”
周南书没接话。她把凉茶倒掉,重新倒了一杯热的。
下午两点多,沈佑宁到了。
他是方远介绍的,中国地质大学做地理信息系统的副教授。方远在电话里说“他想跟你聊聊”,周南书没拒绝。沈佑宁进院子的时候,手里拎着一个黑色的仪器箱,肩膀上挎着相机,后背还背着一个双肩包,看起来像要去野外考察。
“周老师您好,打扰了。”他把箱子放在石桌上,擦了擦额头的汗。
“坐。喝茶还是白水?”
“白水就行。”
周南书倒了杯水递给他。沈佑宁喝了一大口,放下杯子,从包里掏出一台笔记本电脑,打开。
“周老师,我看过您在洛桑县的报告和川西项目的资料。您用堪舆术判断隐患点的方法,我一直很想跟您聊聊。”
“聊什么?”
“聊数字化。”沈佑宁调出一张图,是洛桑县的数字高程模型,“您看,这是我用公开的遥感数据生成的洛桑县地形图。分辨率三十米,能看到大致的地形起伏,但细节不够。您现场观察到的那种小规模的冲沟、陡坎,这张图上看不出来。”
周南书看了一眼:“三十米分辨率,确实不够。洛桑县那个误判的点位,高差只有两三米,三十米的网格根本捕捉不到。”
“对。所以高分辨率的数据很重要。但国内目前能公开获取的高分辨率地形数据很少,价格也贵。我们做研究的,很多时候只能将就。”
沈佑宁说到这里,顿了一下,似乎在犹豫要不要继续说下去。
“您直说。”周南书道。
“国内的地理信息系统起步晚,比国外至少落后五到八年。不是说硬件不行,是软件和算法。国外的滑坡预测模型已经用上了深度学习和多源数据融合,国内还在用传统的统计方法和单一数据源。加上数据共享机制不健全,各做各的,很难做出大模型。”
周南书听着,没打断。她对互联网技术了解不多,但“落后”这两个字她听懂了。
“你的意思是,国内在这个领域,缺数据、缺算法、缺共享?”
“缺数据是最大的问题。”沈佑宁说,“算法可以借鉴国外的论文,但数据得自己采。像您洛桑县那种高精度的野外验证数据,全国都很少。如果能把您的经验和现代技术结合起来,也许能走出一条不一样的路。”
他打开仪器箱,把三维激光扫描仪拿出来,组装好,对着院子里的老槐树扫了一遍。仪器发出轻微的嗡嗡声,旁边的笔记本电脑上慢慢出现了一个三维模型——树干、树枝、树叶,连树皮的纹理都清晰可见。
“这个扫描仪的分辨率是厘米级的。如果带到野外,扫描一个边坡,十分钟就能拿到高精度的地形数据,比传统测量快几十倍。”
周南书看着那个三维模型,沉默了几秒。
“你这个东西,能看出山脊的走向吗?”
“能。而且能算出精确的方位角和起伏度。”
“河谷的横剖面形态呢?”
“也能。软件可以自动提取任意位置的剖面线,计算宽深比和对称性。”
“植被覆盖度呢?”
“植被指数可以用卫星遥感数据反演。如果做精细研究,也可以用无人机搭载多光谱相机现场采集。”
周南书一个一个问,沈佑宁一个一个答。问到最后,周南书停下来,想了想。
“你说的这些,都是技术手段。能拿到数据,能算指标。但有一个问题你没回答——这些数据放在一起,怎么判断?”
沈佑宁愣了一下,然后笑了。
“周老师,您问到点子上了。现在的滑坡预测模型,最大的问题不是数据不够,是指标之间的权重怎么定。山脊走向占多少分?植被覆盖占多少分?不同地形条件下,权重是不是要变?这些问题,现有的模型都给不出好答案。因为做模型的人是搞计算机的,不懂地质。搞地质的人又不懂怎么建模。”
周南书端起茶杯,喝了一口。茶已经凉了,她没在意。
“那你的意思,是需要一个人既懂地质又懂计算机?”
“不完全是。我的意思是,需要一个真正懂判断逻辑的人,把这个逻辑框架搭出来。指标怎么分级、指标之间怎么关联、不同情况下怎么调整权重——这些是经验,不是公式。您脑子里有一套完整的体系,只是从来没有系统地整理过。”
周南书放下茶杯,靠在椅背上。老槐树的影子落在她身上,斑斑驳驳的。
“你说得对。我确实没有整理过。”
她站起来,走进屋里,从书桌抽屉里拿出一个厚厚的笔记本。封面上写着“洛桑县”三个字,边角已经磨损了。
“这是我洛桑县的全部记录。每个点位的观察项、判断过程、最终结论,以及事后复核的结果。你拿去看。看完之后,如果你觉得能整理出什么逻辑框架,我们再聊。”
沈佑宁接过笔记本,翻开第一页,看到上面密密麻麻的字迹和简图。他的眼睛亮了,但没急着翻,而是把笔记本小心地放在桌上。
“周老师,我能拍几张吗?”
“拍吧。别外传就行。”
沈佑宁拿出手机,一页一页地拍。拍了将近二十分钟,拍完之后,他把笔记本双手捧着还回来。
“周老师,我有一个想法,不知道您愿不愿意听?”
“说。”
“我想开发一个辅助系统。把您常用的那些指标——山脊走向、河谷形态、植被覆盖、岩石风化、地下水位——全部量化,输入系统,用洛桑县和川西的数据训练一个权重模型。以后到了一个新的地方,系统先根据遥感数据自动计算这些指标,圈出高风险区域。您再到现场复核,只需要看系统圈出来的点,不用漫山遍野地跑。”
周南书听完,没有马上回答。她在脑子里把这个流程过了一遍。
“你这个想法,我以前没想过。”她说。
“那您觉得可行吗?”
“不知道。但可以试试。”她顿了顿,“不过我有一个条件。”
“您说。”
“系统做出来之后,不能替代人的判断。只能辅助。最后签字的是人,不是机器。”
沈佑宁点头:“这个当然。人机协同,不是机器替代人。”
李建明在旁边听了半天,忍不住插了一句:“沈老师,您这个系统,大概什么时候能做出第一版?”
“如果数据齐全,算法调通,三个月左右能出一个原型。但需要周老师不断验证和反馈。”
周南书想了想:“三个月后我从贵州回来了。到时候可以配合你。”
沈佑宁合上电脑,站起来。
“周老师,我想跟您去贵州。”
周南书看了他一眼:“你去干什么?”
“实地收集数据。您做判断的时候,我用仪器记录地形的三维数据和光谱信息。回来后跟您的判断做对照,看哪些指标好用,哪些不好用。这三个月我也不能光在实验室里憋着,得有现场数据支撑。”
周南书想了想:“你问方远。他同意就行。”
“好。那我回去准备。”沈佑宁背起包,拎着仪器箱,走到院门口,回过头,“周老师,您刚才说的‘人机协同’,这个方向特别好。国内现在都在追国外的模型,没人想过把人的经验直接嵌入系统。您这个思路,可能是另一个突破口。”
周南书没接话。她端起茶杯又喝了一口,这次水是凉的,她皱了皱眉。
沈佑宁走了。
李建明把电脑合上,揉了揉眼睛。
“师父,您觉得那个系统能做出来吗?”
“不知道。”
“如果能做出来,对地质灾害排查的帮助很大。您就不用每个点都亲自跑了。”
周南书站起来,走到槐树底下,仰头看着树叶之间的天空。十月底的阳光从黄绿相间的叶子间漏下来,碎成一片一片的。
“做出来了
【当前章节不完整……】
【阅读完整章节请前往……】
【nmxs8.cc】