全球抢攻炭卷轴难题!欧美领跑AI技术,中国文化研究会失先机吗?

你见过考古学家对着一块黑炭直跺脚的样子吗?两千年前维苏威火山一喷,滚烫的火山灰裹着泥浆,把希腊哲学家费洛・德莫斯聊“音乐”“愉悦”的手稿,严严实实地封进了纸莎草卷轴里,这一埋,就是两千年。

等17世纪被挖出来时,卷轴早变成了一捏就碎的“炭疙瘩”,摸一下怕掉渣,拆一下怕碎成粉,古文书学家只能眼睁睁看着里面的字烂在碳里。

更坑的是,当时写作用的碳基墨水,跟纸莎草本身都是碳做的,就算用红外扫,也像在黑布上找黑线条,啥都看不见。

谁能想到,最后把这些“烧了两千年的文字”救出来的,居然是一行行代码?

考古界的“拆毁式遗憾”

17世纪赫库兰尼姆古城的遗址上,工人刚把那些黑乎乎的“卷轴”挖出来时,考古队差点乐疯,要知道,这可是两千年前希腊学者的手写稿,说不定藏着从没见过的历史知识!

可没高兴两秒,大家就傻了眼,这些不是普通卷轴,是被火山灰高温焖了上百年的“碳化纸莎草”。

这纸莎草本来就娇气,是用芦苇杆压出来的,纤维细得跟头发丝似的,平时保存都得轻拿轻放,一经过碳化,脆得堪比玻璃,稍微用镊子碰一下,就“咔嚓”碎成指甲盖大的碳粉。

当时没别的办法,只能硬着头皮拆,结果大部分卷轴直接在拆解时“灰飞烟灭”,连带着里面的文字一起成了遗憾。

后来就算有了更精细的工具,考古学家也不敢碰那些“相对完整”的卷状炭块,生怕自己的手变成“历史粉碎机”。

更让人无奈的是“认不出”的死结。

那时候的人写东西,用的是碳基墨水,说白了就是炭粉混黏合剂,跟纸莎草的主要成分几乎一模一样。

19世纪有人试过用碘酒染色,想让字显形,结果整块炭都变了色,字反而更模糊,20世纪的普通红外成像也不管用,扫出来的画面里,纸莎草纤维和墨水痕迹糊成一团,连专家都分不清哪儿是字、哪儿是纸。

就这么着,这些炭块卷轴成了考古界的“心病”,明明知道里面有宝贝,却连“看一眼”的办法都没有。

从CT扫描到全球攻坚

考古学家对着炭块叹气了几百年,直到计算机技术冒头,才算有了点希望。

大概二十年前,美国肯塔基大学的研究员布兰德・塞尔斯琢磨出个招,既然不能物理拆,那不如用CT扫描把卷轴“数字化”?

就像医院用CT看人体内部一样,用高分辨率CT穿透炭块,把里面的纸莎草层数、纤维走向都拍成三维数据,以后在电脑上“虚拟展开”,既安全又不会破坏文物。

可想法好,实操起来却难上天。

布兰德团队第一次扫描就发现,这些卷轴卷得比弹簧还紧,层与层之间的间距只有0.05毫米,比一根头发丝还细,偏偏有些地方被火山泥浆挤得缠在一起,活像一团揉乱的毛线。

要在电脑里把这些“毛线”捋顺、摊平,简直跟在浓雾里找路一样,稍微判错一层的位置,整个模型就歪了,更别说找里面的文字了。

就这么卡了十几年,转机终于在2022年冒头了。

硅谷投资人纳・里森偶然看到布兰德的研究,觉得这事儿既有学术价值,又有技术挑战性,就拉着布兰德一起发起了“维苏威卷轴挑战”。

全球的开发者、研究员只要能解决“虚拟展开”或“文字识别”的难题,不仅能拿现金奖励,还能把成果开源,让全世界考古学家都能用。

这个“开源”的承诺,一下勾来了不少跨学科人才。

当时在瑞士苏黎世联邦理工学院读机器人学硕士的朱利安,刷到挑战消息时眼睛都亮了,他平时就喜欢琢磨“计算机视觉怎么解决实际难题”。

这卷轴的“虚拟展开”,这不就是他常想的事儿吗?朱利安没单打独斗,反而加入了一个专门聊挑战的Discord社区,在这里认识了埃及AI研究员尤素福・纳瑟,还有擅长数据优化的卢克。

三个人一聊才发现,朱利安懂三维建模,尤素福精通AI图像识别,卢克会优化代码,刚好能覆盖攻坚需要的所有能力,一个“黄金三人组”就这么凑齐了。

AI的“双步破局”

三人组一分工,就对着CT数据“死磕”起来。

第一步要解决的是“怎么在电脑里把卷轴摊平”,这事儿主要靠朱利安。

他没从头造轮子,反而盯上了肯塔基大学之前开发的基础工具,这个工具能初步认出台莎草的层理,但速度慢、还容易出错,尤其遇到缠绕的部分,经常“卡壳”。

拿到这个难题,朱利安没瞎折腾,优化思路特别实在,先给工具加个“定位系统”。

他引入了计算机视觉里的“光流法”,简单说就是让代码盯着每层纸莎草上的“小标记”,比如纤维的走向、tiny的碳粒疙瘩,就像给每层纸都贴了无数个“便利贴”,不管卷轴缠得多乱,代码都能通过这些“便利贴”找到每层的准确位置。

之后他又优化了算法的运行逻辑,原本要几小时处理的小片段,现在几分钟就能搞定。

更关键的是,朱利安把优化后的代码开源了。

社区里的其他参赛者看到后,都主动给他提建议,有人说“某个缠绕场景的识别精度能再提提”,有人帮他修复了代码里的小漏洞。

就这么在“众人拾柴”的氛围里,工具的性能一路飙升,最后比最初版本快了整整1万倍!

挑战组委会还专门凑了10个人的标注小组,用这个工具在CT数据上画红线标层理位置,再让算法把这些标记导进三维空间,建出卷轴表面的模型。

最后“摊平”成一个个清晰的纸莎草片段,圈里人管这叫“卷轴分割”,而朱利安团队的工具,当时成了最好用的“分割利器”。

“摊平”只是第一步,更难的是“怎么让字显出来”,这事儿交给了尤素福。

可他一上手就碰到了老问题,碳基墨水和纸莎草“长得太像”。

尤素福没急着让AI直接认字,反而先找“参照物”,他沿用肯塔基大学的办法,拿卷轴脱落的小碎片做实验,先用X射线扫描,抓墨水和纸莎草在原子层面的细微差异,再用红外成像增强这些差异。

最后得到了“明确的字母特征”,相当于给AI画了张“藏宝图”,告诉它“你要找的字,长这样”。

可AI刚学认字时,特容易犯“死记硬背”的傻毛病,只认训练过的字母,遇到没见过的新字符,就瞎判一通。

这在AI领域叫“过拟合”,说白了就是AI学“死”了,不会灵活变通。

尤素福和团队试了无数办法,最后想到“随机遮挡数据”,每次训练时,故意挡住一部分CT数据里的特征,让AI不能只靠“死记”,得学会“按规律判断”。

就这么反复迭代了几十次,AI终于能认出没见过的字母,还拼出了20个连贯的字符,这可是人类头一回,从没打开过的碳化纸莎草卷轴里,读出完整的单词!

不止于获奖

到了2023年底评审的时候,三人组的成果一拿出来,基本就没悬念了,直接拿下第一,还登上了全球头条,连英国的小报都追着报道“AI让千年炭块说话”的故事。

但他们没把成果藏着掖着,反而把所有方法、数据、代码全开源了,现在全世界的考古学家,都能用他们的工具解读那些“碰不得”的碳化文物。

甚至有团队已经用类似思路,试着解读意大利庞贝古城出土的碳化木简,还有中东地区发现的古代羊皮卷残片。

其实这事儿最让人觉得暖的,就是AI在这儿没耍花架子。

它不像传统工具那样“硬碰硬”,反而用代码的“温柔”,小心翼翼地“剥开”了时间的外壳,它也不是孤军奋战,靠“开源协作”把全球研究者的智慧聚到了一起。

以前考古学家面对脆弱文物,只能“看得到、碰不得”,现在有了AI,就算是一掰就碎的炭块,也能通过代码“读”出里面的故事。

两千年前,费洛・德莫斯在文稿里写“我们从不回避追问,也从不放弃理解”,两千年后,AI用一行行代码,回应了这份跨越时空的追问。

那些被火山灰封存的思想,那些差点烂在碳里的文字,终于不用再沉默,而这,大概就是技术最浪漫的地方,它不仅能帮我们走向未来,还能帮我们“找回”过去。

以后说不定还有更多埋在地下的历史,会被AI扒得明明白白,我们也能隔着千年时光,再好好听听古人的思考。

在我看来这样并不会让中国对文化的研究失去先机,相反,我们在得到前人的经验和教训之后,会更好的利用AI来做文化研究。

展开阅读全文

更新时间:2025-10-19

标签:科技   卷轴   先机   研究会   难题   欧美   全球   技术   莎草   考古学家   代码   工具   墨水   数据   火山灰   肯塔基   文字

1 2 3 4 5

上滑加载更多 ↓
推荐阅读:
友情链接:
更多:

本站资料均由网友自行发布提供,仅用于学习交流。如有版权问题,请与我联系,QQ:4156828  

© CopyRight 2020- All Rights Reserved. Powered By 61893.com 闽ICP备11008920号
闽公网安备35020302035593号

Top