186. 新建文件夹:扩散模型

类别:都市言情 作者:CloseAI字数:2501更新时间:24/10/13 09:45:48
    除去孟繁岐在华国时推行的人脸识别方法已经大行其道,最近他在医疗影像诊断分析领域的一系列工作,其实也已经在加州的圈子里率先展开了试用。

    那句话怎么说来着,【获得了几百名教授一致通过】。

    尤其是湾区附近两所最顶级的高校,斯坦福和伯克利两个派系。由于他们在人工智能比较没落的时候仍旧坚持研究,因而也对这些迟到的果实感到格外珍惜。

    斯坦福肿瘤方向的教授刘勇使用了这系列算法之后,感到十分惊奇,这电脑明明一两年前才刚刚学会分辨什么是猫,怎么现在突然就这么生猛了?

    尤其是比较难一点的病症,自己带的几个学生分辨起来一看就是十几二十分钟,这东西倒好,几秒钟就能给出一个答复。

    为此,他私下里和孟繁岐聊过两三次,大概了解了原理,也为他协调提供了不少数据作为支持。

    有一次,刘勇教授向孟繁岐询问道:“既然人工智能已经可以对图片中病变的种类,区域和轮廓都做出如此准确的分析判断,那能不能帮忙把医嘱或者文字分析也给写了?”

    孟繁岐听完顿时语塞,没想到刘教授接受新事物的速度还挺快,已经做上白日梦了这是。

    他只得实话告诉刘教授,别说语言和图像的结合的多模态了,目前语言模型本身都仍旧是一个相对急需突破的领域。

    想要实现他需求的功能,恐怕还得几年。

    斯坦福的其他医学教授,比如杰佛雷主任等人则非常看好孟繁岐阿尔法fold项目,尤其是杰佛雷,他曾经担任二十多个临床药物研究的首席调查员,因而非常能够理解这种蛋白质分析能力的价值。

    杰佛雷是个大脑门,有点胖乎乎的中年男子,满面红光,对待学生十分热情。

    在得知孟繁岐的阿尔法fold项目很是缺乏高质量的蛋白质数据之后,也非常积极踊跃地提供了协助。

    总体来说,斯坦福医学派系对本校学生的的突破相当热情,借助着加州这两所顶级高校的影响力,孟繁岐的成果正在慢慢地向外辐射。

    只不过大量数据的准备,并不是区区几天就可以有显着成效的。

    即便加州相关方面的教授集体支持,积累数据的速度仍旧远远要比孟繁岐所想的慢不少。

    阿尔法fold项目的正式开启时间,至少要往后延一到两个月。

    因而在开学前的这段时间,孟繁岐的蛋白质分析大计不得不进入了一段时间的停滞期。

    “技术提的太快,就是会碰到这种问题。”孟繁岐有些无可奈何,别说很多领域还来不及接受和消化自己做出的能力提升。

    这些地方原本积累的那点数据在新的技术面前,完全不够看,数量实在太少了。

    即便他们能够及时调转车头,开始进行优质数据的积累和标注,肯定也是要一段时间的。

    数据跟不上,孟繁岐即便理论再好,却也难做出足够好的效果,不足以让人信服。

    “我也算是搞了好个月的应用技术了,现在数据上要等一两个月,看来是时候做点基础工作,为以后铺垫了。”

    时隔多月,孟繁岐也算是终于被迫静下心来,有了足够的时间做一些基础的理论方法,而不是急于做产品又或者是变现。

    毕竟,往后的技术不管是AI生成语音,图像还是文本,目前的这些技术理论还有不小的缺陷和问题。

    他计划最近开发的,便是后来非常火热的一款图片生成技术,Stable Diffusion的基础部件,diffusion原理。

    这是后来许多优质生成技术的基石,非常适合现在做准备。

    扩散(diffusion)模型,这个比较不明觉厉的名词,虽然后来知晓原理的人很少,但很多人却都听过这个名词多次。

    从AI绘图软件生成的作品打败一众人类艺术家,斩获数字艺术类冠军,到后来Midjourney,、Imagen、novelai等国内外平台遍地开花。

    越来越多的人都曾点开过相关网站,尝试让AI描绘脑海中的画面,又或者是进行局部的修改调整。

    有以文生图,各种神秘咒语召唤古神的,也有以图生图,闹出各种神奇笑话的。

    2022年,AI绘画,AI生成图像,在短短几个月内数次进步。

    每一次的进展突破都带了了肉眼可见的提升,远超人类的想象。

    就在22年年关左右的时候,大家都还在嘲笑AI绘图是什么东西,实在太过丑陋了。

    结果三个月后就发现事情似乎没有那么简单,AI开始大量产出各种波涛胸涌的绘图,这吸引了相当一部分人们的注意力。

    那时不少人还在开玩笑说,虽然AI画得不行,但你真别说,它对题材的把握还是非常不错的嘛!水平不够,题材来凑。

    等再过三四个月,到22年底的时候,AI绘画的水平和能力已经无人再去争议了。

    这回大家主要争论的点又变了,变成了AI绘图究竟是不是抄袭,AI水平和画师究竟谁更强。

    抛开到底谁更强这件说不清的事不谈,单从大家争论的这些内容就能看出,AI绘画的能力确实进步得非常之快。

    “平心而论,在AI生成这件事情上,GAN生成式方法是让大家走了弯路的。”

    虽然孟繁岐的GAN生成式办法在学界广受好评,建立起了很高的学术声誉和知名度,FaceGAN的假脸生成效果也颇为惊艳,但最终真正让AI制图火起来的还是扩散模型。

    “GAN办法生成对抗的模式固然让人感到惊为天人,但两个网络彼此对抗学习,毕竟还是非常麻烦的事情。”孟繁岐思忖了一下,现在的大难题,数据是一方面,计算设备则是另一方面。

    本来自己提前发布技术,显卡就已经很不够用了。目前用GAN去针对某一个特定的事物,比如FaceGAN只做人脸还是比较可以的,但想要从文本直接生成,那难度可就大了。

    扩散模型的原理其实并不难,主要是通过对照片添加噪声,然后在这个过程中学习到当前图片的各种特征。之后再随机生成一个服从高斯分布的噪声图片,然后一步一步的减少噪声直到生成预期图片。

    代码写起来不是那么困难,不过若是写成论文,琢磨其中的原理,那里面的数理逻辑和推导,够孟繁岐喝一壶的。

    “数学这方面....这两天找韩辞和付院长他们帮帮忙吧,好久没怎么跟他们联络了。或者也可以请辛顿和李飞飞指点一下,这两位都算是我的导师。”涉及数学问题,找数学专业人才自然放心。

    李飞飞和辛顿虽然不是数学出身,但李飞飞有物理背景,辛顿更是领域内教父,两者在这方面实力想必也很强。

    新建了文件夹,孟繁岐刚准备开始工作,却隐约感觉哪里不对,自己好像遗忘了什么事情。

    半晌才想起来,自己的倒霉室友唐璜今天要到斯坦福附近来。

    “这大半年过的,差点忘记我自己还是个学生了。”

    高强度研发了三四个月的孟繁岐,感觉时间好像已经过去了一年多。

    正好唐璜来了,就给自己放几天假吧,来了也有几周了,却一直没有好好逛过斯坦福的校园。
推荐都市大神老施新书: