第741章 文字的特征

类别:网游竞技 作者:剑走偏锋字数:2046更新时间:24/08/17 18:57:55
    语言,并没有多么神秘,其实就是智慧生命用来交流的方式。

    任何的交流方式,都需要介质。

    人类用声音交流的介质是空气。

    因此,正常情况下,存在大气的行星上,如果蕴育出了生命,那么这些生命也会渐渐进化出用声音交流的能力。

    每一种交流方式,都和生物的身体感官有关。

    人类除了可以用声音交流之外,还可以使用肢体语言,而肢体语言使用的感官器官是眼睛,通过视觉传递信息。

    如果一种生物,进化出了发射电磁波的器官,那么也将出现更加快速的交流方式。

    无论使用什么方式进行交流,只要想把信息记录下来,那就必然会产生文字。

    军科院的电子信息部门,用了三天的时间,把陨石微生物基因里记录的所有信息都找了出来,并给出了一份更详细的报告。

    “从碱基编码分析来看,陨石文明留下的信息,应该是以文字作为载体……“

    鲁修文一边看着分析报告,一边向军事科研班的学员讲解:“陨石文明在微生物基因编码里留下的文字,大概有两万个字,或是词。

    “其中不重复的独立单字或单词,超过2000个。从这个特征来看,陨石文明的文字,重复率并不高,不属于英语类的字母文字。”

    “怎么看出来不是字母文字的?”牛大志好奇的追问。

    “这还不简单吗?如果是字母,就只有26个,怎么出现2000个不重复的单字?就算陨石文明的字母特别多,有100个字母,那也就是100个独立不重复的字母,不会是2000个。除非这文明脑子有坑,弄出来2000个字母。”伊芙摊手解释道。

    “好,没有英语太棒了。”牛大志立时鼓掌叫好。

    伊芙捂着额头,露出一副已经没法拯救的表情。

    “如果是2000个字母,以这种庞大的字母库,单个字母应该会有单独的意义,这其实已经和单字没有区别。英语之所以单个字母不具备含义,就是因为字母库太小,需要多个字母才能表达含义。”鲁修文补充一句。

    在场的除了生物研究院的教授之外,还有几位宇宙社会学的教授。

    在外星文明的研究上,郎同光是更专业的。

    他取出一份资料,发给面前的几人,讲解道:“其实,在拿到军科院对陨石文明留下信息的分析报告之后,我和几位同事立即做了文字对比。

    “这份就是我们用几份汉字论文做的单字统计,由于陨石文明信息分析中显示,总共有两万字。

    “所以,我们挑了几篇两万字左右的论文做统计,结果就是,论文中独立不重复的单字,数量在1000个到1400个之间。

    “英文的论文就暂时不考虑的,不重复的独立字母只有26个,加上阿拉伯数字数字是36个,没有参考价值。

    “我们做的汉字文献单字统计,做了一百多份,结果都在1000个到1400个之间,平均下来是1200个单字。

    “样本是足够的,所以基本可以确定,以汉字撰写的文献,在2万字篇幅下,不重复的独立单字平均1200个。

    “这和陨石文明的2000个不重复独立单字,有一些差距。不过差距不到两倍,这个差距在外星文字的研究上,其实并不大。

    “因此,从出现的独立单字数量来看,陨石文明所使用的文字,和汉字有相似的特征。

    “可以初步确定,陨石文明的文字库,应该比汉字大,他们常用的文字数量也比汉字多。

    “根据这些文字特征,进行破译,会简单很多。”

    方源思索片刻后问道:“要多久才能破译出这些信息的含义?”

    “这个还无法确定,由于没有一个基础点,要用穷举法进行破译,难度很大。而且,更困难的是,即便是穷举法,也没有一个标准答案,即便破译出了结果,也无法确定破译的结果是否正确,这才是最困难的地方。”郎同光解释道。

    “没有更好的办法了吗?”方源觉得军科院的技术手段,应该不至于此。

    “办法当然是有的,可以通过猜测,先确定一部分文字……”

    郎同光接着解释:“比如,通过分析,我们已经基本可以确定,陨石文明是所有的文字,和汉字有很多特征相似。

    “那么,我们就可以更进一步猜测。陨石文明所留的文献里面,重复最多的字代表什么含义?

    “比如汉字文献里面,重复最多的字,一般是‘的’字,第二的是‘是’字。

    “那么,我们就可以继续猜测,陨石文明的文字里面,是不是也有‘的’这样的字。

    “如果有,重复最多的那个字,是不是就是‘的’,或者是含义相近的字。

    “当然这只是猜测,因为汉语中的‘的’是个助词,本身没有含义。

    “我们还不能确定陨石文明的语言中,也有这样的无意义助词。

    “所以,这个猜测的过程需要进行验证,才能确定是否正确。”

    鲁修文接过话头道:“确实,对于外星文字的研究,难度确实比较大。它还不像甲骨文,甲骨文还能通过文字的形状猜测其含义。

    “现在摆在我们面前的是一串没有含义的编码,要通过编码的特征猜测文字的含义,难度确实大。”

    方源一边思考一边点头道:“确实,不过,也可以先猜测一下陨石文明有可能留下什么信息,再和进行编码破译。

    “比如,陨石文明在毁灭时,最想要留下的信息,开篇应该先介绍他们的文明。然后应该还会讲述文明灭亡的原因,是被高等文明毁灭的?还是在宇宙天灾中毁灭的。

    “先对信息的内容进行推测,再进行文字破译,应该会容易一些吧?”

    郎同光点头赞同道:“这个思路是对的,不过还是需要超级计算机来进行破译,人类的大脑优势是想象力,但在计算力上,还是计算机更有优势。”

    “应该不用太长时间,一两个星期,应该就能得出结果。”鲁修文说道。