LRC歌词
[ar:]
[al:]
[by:AI智能字幕]
[offset:0]
[00:00.00]本字幕由TME AI技术生成
[00:00.27]本节目由生动活泼制作播出
[00:02.69]Hello
[00:03.07]大家好
[00:03.53]我是丁教
[00:04.29]欢迎收听今天的硅谷早知道
[00:09.09]十一月三十日
[00:10.25]Alpha four 的系统在在第四四国际蛋白质结构预测竞竞赛casp 夺冠
[00:16.47]平均拿下九十二点四的中位数的高分
[00:20.13]这个竞赛其实是九四年由美国马里兰大学的约翰
[00:23.83]穆尔特和同事们发起的
[00:25.75]比赛的目的是比较计算机预测的蛋白质的结构和实验室的结果
[00:30.83]得分如果在九十分以上
[00:32.65]就可以认定为与实验室结果一致
[00:35.33]相比于第一次出现在大家视野里的alpha four
[00:37.87]大家可能对google deep mine 的alpha go 是非常熟悉了
[00:41.46]Deep man 我们再重新说一下
[00:43.19]它是一家英国的人工智能公司
[00:45.59]公司创立于二零一零年
[00:47.69]在四年后被谷歌收购
[00:49.81]Deep man 创造了一个以重新的一式学习如何玩电子游戏的人工神经网络
[00:55.07]并且这个神经网络可以介入一个外部的存储器
[00:58.85]就像一个传统的图灵机一样
[01:00.79]使得一台电脑可以模拟人类的短期记忆
[01:03.91]很多人一看到这种晦涩难懂的生物名词和奇奇怪怪的三d 蛋白质模型
[01:08.84]对这个话题望而却步了
[01:10.48]我一开始也是这样的
[01:11.84]但是我们不能忽视阿尔法four 的研究成果对于我们的长远意义
[01:16.86]蛋白质折叠是生物学最大的三个未知问题之一
[01:20.88]首先
[01:21.38]它关系到代代相传的遗传信息到底是怎么指导生命活动的
[01:26.26]其次
[01:26.76]它有很强的应用价值
[01:28.32]因为绝大多数的药物都是通过结合特定蛋白质来起作用的
[01:32.86]如果我们能搞清楚蛋白质的分子怎么折叠
[01:35.70]三维的结构长成什么样子
[01:37.24]我们就能够更方便的设计出来药物来治疗疾病
[01:41.29]所以本期的硅谷早知道我们就来深入浅出的聊一聊尔法alfour
[01:45.28]以及我们为什么要关注和了解这个领域
[01:48.18]今天我们的嘉宾是张璐
[01:50.18]他在二零一五年成立了自己的基金fusion fund
[01:53.30]这家基金在硅谷专注于高科技行业以及医疗行业的中早期投资
[01:58.02]也是我们硅谷早知道的老朋友了
[02:00.12]Hello 张璐
[02:01.04]欢迎再次来到我们的硅谷早知道
[02:02.72]林江 你好
[02:03.68]大家好
[02:10.78]欢迎来到生动活泼传媒旗下硅谷早知道第四季
[02:14.44]这个世界因科技创新而巨变
[02:16.92]那就请和我们一起在最前线观察科技创新所带来的变化
[02:21.56]影响和机遇
[02:23.54]嗯嗯
[02:26.46]所以 张璐
[02:27.36]能不能帮我们通俗的聊一聊蛋白质折叠到底是什么一个东西呢
[02:32.74]嗯 好的 丁佳
[02:33.78]你好 大家好 嗯
[02:34.92]确实
[02:35.46]其实阿尔法go 的像你讲到的
[02:37.50]并没有说像阿尔法狗和阿尔法zero 之前引起了那么多公众的啊一个关注
[02:43.00]但实际上从我们无论是说做技术
[02:45.96]做科技投资
[02:46.78]还是做学术的角度来讲
[02:48.04]其实它的无论是说在科研上面的贡献
[02:51.06]甚至说在未来技术转型商业化的贡献
[02:53.44]实际上可能比阿尔法狗和阿尔法zero 都要巨大
[02:56.64]那你刚才问到说怎么样通俗的去解释这个蛋白质折叠
[03:00.60]我可能也就是通俗的给大家大家解释一下
[03:03.36]其实蛋白质折叠它是啊
[03:05.48]就是我们经常讲说有生物学家
[03:07.44]生物学家中还有结构生物学家
[03:09.68]这一类是结构生物学里面一个非常核心的一个挑战
[03:13.66]也是非常重要的一个领域
[03:15.62]首先就大家对蛋白质应该很熟悉对吧
[03:17.86]我们身体的组成部分就是蛋白质
[03:20.04]很多生物的生物体的组成部分也是蛋白质
[03:23.76]而蛋白质折叠实际上就是在蛋白质的一个三d 的一个空间的一个结构
[03:29.03]而这个空间结构去决定了蛋白质它本身的各种各样的功能还有性能
[03:35.39]我们拿人来举例的话
[03:36.65]我们身体中实际上是有就是十几万种的一个蛋白质
[03:40.41]那大家都知道
[03:41.09]蛋白质它基本组成单元就是我们经常讲的氨基酸嘛
[03:43.73]大家经常讲说吃什么东西里面有什么氨基酸
[03:46.19]那自然界它一共的氨基酸种类是二十种
[03:48.77]那我们如果再细的讲的话
[03:50.63]说氨基酸它是怎么样去形成蛋白质的
[03:53.43]因为氨基酸其实我们就想说
[03:54.75]如果我们把人身体看成一个大的机器
[03:56.91]那蛋白质呢
[03:57.81]就是一个一个的零件
[03:58.89]氨基酸呢
[03:59.67]就是连接
[04:00.27]就是组成你像一个一个非常小的那个部件
[04:03.03]或者说是particle
[04:04.05]那蛋白质它最基本的过程是氨基酸
[04:07.27]氨基酸它最基本呢
[04:08.65]其实上就是通过一个肽链的方式去连接
[04:11.95]所以我们就可以想象一下
[04:13.81]我们有二十种天然氨基酸
[04:15.43]这些氨基酸呢
[04:16.27]它会进行各种各样方式的连接
[04:18.89]它通过肽链连成了一个线性的多肽链
[04:21.65]就像一串项链一样
[04:23.27]那你一样把这样一个一个氨基酸通过像项项链的形式连成一链链之的话呢
[04:28.56]是不是是它的组成它的顺序会不一样
[04:32.36]由于比如说在这这样的一项链链里面
[04:34.52]它穿的这些氨基酸的种类或顺序不一样呢
[04:37.38]它就会让这个氨基酸的形成的这个多肽链呢
[04:41.04]形成不同的折叠
[04:42.60]它可能会形成各种空间角度的折叠
[04:45.12]那在这个折叠的过程中
[04:47.16]形成的这个过程就叫我们讲的蛋白质折叠
[04:50.24]由于这样的折叠
[04:51.32]最后形成的具有特定的三维空间结构的蛋白质呢
[04:56.24]就是蛋白质的结构
[04:57.42]而这些不同的结构呢
[04:58.74]又决定了这些蛋白质它不同的一个特性和不同的一个功能
[05:03.86]甚至说
[05:04.44]大家讲
[05:04.84]因为我是在斯坦福大师学科
[05:06.72]我是学材料科学工程的
[05:08.14]我们当然就很多分子结构啊
[05:09.66]原子结构
[05:10.22]我们经常比如说给大家举一个例子
[05:11.74]像异构体
[05:12.58]异构体就是说
[05:13.36]你看它的分子式是一样的
[05:14.92]但它其实三体空间是不一样的
[05:17.08]其实对蛋白质也是类似
[05:18.66]就哪怕说你连在这个一个项链上面的这些
[05:22.18]就是这几种种类的氨基酸是一样的
[05:24.50]但它们的排列顺序不一样
[05:26.35]它的折叠方式也会不同
[05:28.19]而且加的这个折叠是三d 的三维的一个折叠
[05:31.63]所以也就是说
[05:32.37]它的排列组成可以有各种各样的一个可能
[05:35.17]不是一个简单的说
[05:36.51]我们将算概率
[05:37.53]说cc 级的这样的一个概率率以这就是为什么这个领域域它非常的复杂
[05:43.89]包括说为什么蛋白质折叠是这么这么样的功个在结构生物学的一个命题
[05:49.27]嗯嗯
[05:50.03]那为什么大家需要研究蛋白质折叠
[05:53.99]我们在科学上面是通过蛋白研究蛋白质的折叠能够达到什么么样的一目目标呢
[06:00.09]嗯
[06:00.25]因为其实就是我刚才的蛋
[06:01.63]蛋白质结构
[06:02.53]尤其它
[06:02.95]它个三d 结构呢呢
[06:04.69]它决了了它够做什么样样功能能就比如说
[06:08.71]我其实身体里有各种各样的蛋白质嘛
[06:11.43]那它的每个蛋白质特定的功能是决定于它独特的三d 结构
[06:15.25]比比说说
[06:15.81]我们经常讲我们这个免疫系统
[06:18.15]我们会有抗体
[06:19.35]他的这结结构呢
[06:20.41]是有点像我们这个字母y 一样的形状的
[06:23.01]那它这个形状也就决定了它能有什么样的功能是一个对应的
[06:28.66]那比如说像我们经常女生讲的这个胶原蛋白对吧
[06:31.66]胶原蛋白流失胶原蛋白
[06:32.84]它就像一个绳子的形状一样
[06:35.04]然后它也是有一个特定的结构
[06:37.48]包括我们现在讲说copy n iting
[06:39.46]对吧
[06:39.70]冠状病毒
[06:41.18]然后怎么样去发掘它
[06:43.42]到底这个蛋白会形成什么样的作用
[06:45.42]我们也是要从结构的角度去入手
[06:47.48]我们理解了它如何折叠
[06:48.92]形成怎么样的结构
[06:49.92]我们就可以预测说
[06:50.88]哦
[06:51.40]原来它可能是这样的这样的功能
[06:53.28]那我们在针对这个病毒
[06:54.88]无论是去研究怎么消灭它
[06:56.60]或者说是疫苗的时候
[06:58.14]才能够更加更加的有效
[07:00.00]所以这也是为什么说这是一个关键核心
[07:03.48]也是一项非常非常复杂的任务
[07:06.70]呃
[07:07.10]实际上可能很多大家也都有听到
[07:09.38]最早的就是由我们这个基因序列来去推断预测蛋白的三d 结构呢
[07:15.96]是在其实是很多年前
[07:17.58]大概我记得是七二年的时候
[07:18.96]当时有一个诺贝尔化学奖的一个得主
[07:21.26]他当时就是提出了这样的一个构想
[07:23.76]因为他觉得他提出的构想就是说
[07:25.91]在蛋白质
[07:26.45]我刚才提到了
[07:27.23]它首先是由氨基酸连连成的一个项链对吧
[07:30.23]然后这个项链由于它的排列还有种子类
[07:32.55]然后进行折叠
[07:33.71]他提出说
[07:34.41]这个氨基酸排列的一个这个序列
[07:36.39]它能够决定它的一个三级结构
[07:38.55]所以大家提出了这个设想之后
[07:41.11]就有很多的结构生物学家在这个方向上去进行探索
[07:45.39]所然可能大家第一个想到的就是一个穷举法
[07:48.07]但是我刚才也给大家解释了
[07:49.41]就是如何折叠的
[07:50.97]如果用穷举法的方式去探索
[07:53.57]那就是无穷无尽
[07:55.47]但是现在实际上阿尔法的让大家觉得非常兴奋的一点
[07:59.41]其实就是用深度学习的方式
[08:01.41]用建模的方式
[08:02.97]其实是一种更更聪明和更高效的方式去进行更加精准的一个预测和判断
[08:08.41]嗯
[08:09.01]所以我看到很多文章也是说
[08:10.71]是不是这个阿尔法fofour 出来之后
[08:12.71]大家蛋白质结构科学家就要失业了
[08:16.99]嗯 呃
[08:17.99]我觉得其实这也是
[08:19.67]怎么说呢
[08:20.37]这个就跟我们整体上去聊很多人工智能在医疗领域的应用应用一样
[08:25.27]因为我其实一直在投的也是人工智能在医疗领域的应用嘛
[08:29.23]其实我觉得不管是说我们阿尔法four 的这个例子
[08:31.99]还是说其他的一些人工智能在整个医疗领域的应用
[08:35.45]它现在在现阶段
[08:36.71]它主要的一个功能还是赋嘛
[08:38.99]甚至说我们在赋能
[08:40.29]在进一步说解放
[08:41.51]就是进行效能提升
[08:42.95]它是一个非常有效的工具
[08:44.79]去进行更加好的一个效能提升
[08:46.95]去解决一个步骤的问题
[08:49.57]但是生物相关的各种各样的问题
[08:52.47]它其实是非常非常复杂的
[08:54.39]那而且其实包括我们讲说阿尔法four 的为什么现在效以取得
[08:58.77]因为它一八年就参加了比赛
[09:00.45]包括前一段三月份
[09:01.53]他有提出当时对于冠状病毒的各方面蛋白结构的一种预测嘛
[09:06.37]虽然说那个预测结果也很好
[09:07.99]但是当时我觉得很多人没有关注他预测准确的那个几个很准确
[09:11.63]但他剩下那些就很离谱
[09:13.39]就是差的很大
[09:14.59]到现在对次参加比赛的这个准确率进一步的提升
[09:18.30]当然一方面是他算法的一个提升
[09:20.10]但另外一方面也是因为
[09:21.80]呃
[09:22.16]本身基础的这些就是结构生物学的研究
[09:25.10]包括说我们现在已知的这几万个蛋白质的模型的这些数据的进一步的增加
[09:29.76]还有包括他团队里
[09:30.96]实际上你会看到有很多很多非常顶尖的结构生物学家去进行这种跨学科的信息的一个整合
[09:37.20]我觉得这是一个关键
[09:38.92]所以回到你
[09:39.80]就是最初的问题
[09:40.78]到底说 呃
[09:41.76]这些科学家会不会失业
[09:43.42]我觉得是
[09:44.32]我觉得是不会失业的
[09:45.70]我觉得其实是像我提到的
[09:47.34]用人工智能作为一个工具
[09:49.30]去帮助他们进行更有效的蛋白质结构的一个判断和预测
[09:54.62]同时的话呢
[09:55.40]也可以让生物学家
[09:56.68]比如说可以进一步的推动他们在一些领域的进一步的一个研究
[10:01.54]或者说
[10:02.06]我觉得就比如说现在阿尔法fold 是取得了非常好的一个成绩
[10:06.18]他可以去很精准的预测这些蛋白质的结构
[10:09.26]但是另外一方面
[10:10.48]其实还有很多一些关键性的啊问题没有被解答
[10:14.56]或者说暂时或以后也很难去被阿尔法go 去解答
[10:18.53]因为比如说
[10:19.93]为什么就是这个结构会导致这样的功能
[10:23.03]对吧
[10:23.43]那导致这样的功能之后
[10:24.87]再进一步怎么样去做
[10:25.95]所以我觉得从这个程度上来看
[10:27.91]我并不觉得结构生物学家会失业
[10:30.01]那它可能阿尔法狗在某种程度上
[10:31.75]它可以替代比较简单的蛋白质的结构生物学
[10:35.09]但是我们真正的结构生物学家
[10:37.41]它做的不是简单的蛋白质的结构生物学
[10:39.79]它有更多更复杂的结构去等着一个解析
[10:43.05]而且阿尔法狗在短期也不可能替代实验
[10:45.75]因为在生物学的实验中
[10:46.93]它其实蛋白质功能才是最重要
[10:48.81]结构是一个中间的一个变量
[10:50.61]它很重要
[10:51.37]但是我们理解结构之后
[10:53.29]我们还要理解后面的一个从动力学的角度去理解
[10:56.25]说到提它这个蛋白质功能是怎么样去实现的
[10:59.91]所以我觉得这是一个非常重要的一个切入点
[11:03.19]当然还有很多其他的方面
[11:05.21]简而言之
[11:05.95]就是它实际上是一个加速
[11:07.95]是一个赋能
[11:08.85]但是它不会是一个替代
[11:10.47]其 嗯
[11:11.31]我能不能这么通俗的理解
[11:13.11]哈
[11:13.29]就有点像我们可能吃中药一样
[11:15.33]其实我们这么多年
[11:16.53]几千年年来总结出的经验
[11:18.62]我吃这个
[11:19.28]我它就是的
[11:20.54]然后就等于说是
[11:21.38]我们现在其实我们知道这样的蛋白有这样的功能
[11:24.26]但是它的结构怎么样
[11:25.46]原理怎么样
[11:26.12]它跟它最后的结果是怎么样
[11:27.86]我们其实不知道这个联系在哪儿的
[11:30.32]对对对 是的
[11:31.46]是的
[11:32.10]另外的话
[11:32.68]其实你想
[11:33.28]我们每次聊到人工智能
[11:34.94]要到深度学习
[11:35.90]其实它的核心是什么
[11:37.10]它核心还是需要大量的高质量的数据
[11:40.50]所以你看我这里面两个核心的就形容词
[11:43.10]一个是说数量要大
[11:44.54]另外一个是质量要高
[11:46.14]但现在我们实际上已有的生物数据的质量和数量都还远远不够
[11:51.00]而我们现有的这些
[11:52.52]就是这些数据
[11:53.82]实际上是来自于现在已有的这些实验手段的
[11:57.00]所以我觉得这两个一定是相辅相成的
[11:59.20]当这些比如说像冷冻
[12:00.58]电进这种实验手段更多的去结构出更多的新的更多质的数据
[12:04.86]这些数据会反向来服务阿尔法的
[12:07.10]让它变得更加准确
[12:08.36]但同时的话
[12:09.08]阿尔法worfofood 也会给出更好的一个预测
[12:11.42]其实帮助啊
[12:12.52]这些科学家去缩短他们整个在实验过程中的
[12:16.14]呃
[12:16.70]时间的损耗
[12:17.83]包括在尤其是说资金的投入
[12:20.05]其实每次结构生物学家去解构一个蛋白质过程
[12:22.87]实验成本
[12:23.57]各方面的成本是很高的
[12:25.31]所以我觉得这两个是相辅相成
[12:26.99]相互赋能的一个阶段
[12:28.71]嗯嗯嗯
[12:29.57]能不能给大家通俗讲一讲
[12:31.47]冷冻电镜是什么东西啊
[12:33.25]嗯
[12:33.51]我其实也不知道怎么样可以去跟大家从头讲说什么是冷冻电镜
[12:37.15]冷冻电镜
[12:37.75]它全称应该是要冷冻的电子显微镜
[12:40.07]通过冷冻电镜
[12:40.95]实际上是希望可以通过温度
[12:43.59]其他各方面的参数的控制
[12:45.09]可以取更更加以原形的方式去保持蛋白质它本身的一个初始的形态
[12:50.41]这样才可以在它不受损伤的基础上
[12:53.09]去研究它的一个结构
[12:54.87]所以冷冻电镜是我们现阶段就是在
[12:58.07]呃
[12:58.27]实验中很多去应用来去解构蛋白质的一个结构
[13:02.15]三d 结构的
[13:02.91]那除了冷冻电镜之外
[13:04.17]当然还有大家经常听到的
[13:05.89]像我们材料也经常用的
[13:07.17]像是xrd 对吧
[13:08.61]Xrd 用的也很多
[13:09.65]另外就mi 是那个核磁共振
[13:11.69]这个也用了很多
[13:12.83]所以实际上是通过各种各样的方式
[13:14.91]有一维 二维
[13:15.59]三维的方式
[13:16.25]各种这样啊
[13:17.98]Imagine 就是成像的这种方式
[13:19.86]去解构蛋白质三d 模型
[13:22.48]嗯嗯嗯
[13:23.36]所以我不知道这个能不能给大家一个可能
[13:25.78]在概念上
[13:26.50]就传统我们可能确定一个蛋白质它的结构
[13:29.74]比如说是用冷冻电竞大概是需要多长时间
[13:33.04]然后有了这个alpha four 之后
[13:34.94]我们大概是可能把这个效率能够提高多少的
[13:38.64]嗯
[13:38.80]我觉得这个过程中
[13:39.90]一方面像我刚才提到的
[13:41.40]你看
[13:41.64]你要使用像冷冻电镜
[13:43.12]核磁共振
[13:43.80]Fxrd 这些时间技术
[13:45.66]它本身就是有很多时间上的损耗
[13:48.46]所以在这个过程中
[13:49.56]它际上是一个实验验过程程
[13:51.48]实验过程程一定会出现蛋误
[13:53.20]这个个错误
[13:53.86]可可能有时间误误
[13:54.98]也有人为错误
[13:55.84]所以这个过程有需要很长一段时间
[13:58.00]所以很多时候
[13:59.14]每个蛋白质解构的一个成本
[14:01.20]有些甚至可能需要花费很多时间
[14:03.38]但大家想想
[14:04.02]有多少蛋白质
[14:05.10]每个蛋白质就要花费每个单计算单位的时间
[14:08.70]所以它的成本也是上十万美元的这样的一个成本
[14:12.56]所以它无论是时间还有资金的消耗都是非常巨大的
[14:16.86]那生物学家想利用人工智能这个方法呢
[14:20.01]也是因为这个过程实在是太低效了
[14:22.89]而且是非常非常的昂贵
[14:24.61]所以如果是像阿尔法fold 的话呢
[14:27.23]其实他们的时间就可以大大的缩短
[14:29.91]首先成本当然大大缩短了
[14:31.53]这个就毋庸置疑
[14:32.59]他不需要去画这个实验的过程
[14:34.61]但同时的话
[14:35.55]时间层面上也可以大大缩短上
[14:37.31]比如说几周
[14:38.43]甚至说可能复杂一点
[14:40.09]它这个也是有一个range
[14:41.61]从天数到周数
[14:43.47]到月数
[14:44.07]都是有的
[14:44.67]但是基本上跟以往相比的话
[14:46.85]要大大的提升
[14:47.89]至少说
[14:48.65]我们如果是从年到月的一个跨度
[14:50.47]大概是十倍以上
[14:51.49]甚至是二十倍
[14:52.37]五十倍以上
[14:53.89]那还是这很大的一个科学的一breakbreakthrough
[14:57.61]是的 因为
[14:58.27]因为这个领域其实还是蛮深蛮这个前沿的
[15:01.95]因为我自己其实看了好多篇文章
[15:04.11]也都是非常的摸不着头脑
[15:06.93]所以我就觉得
[15:07.73]就科学解决的这个是很大的一个breakthrough
[15:10.23]但对于普通人来说的话
[15:11.77]那它到底意味着什么
[15:13.99]我们能够期待他们在商业上面很快的有应用嘛
[15:17.71]嗯 我觉得
[15:18.79]其实就
[15:19.51]首先我觉得大家还是要理解一点
[15:21.51]就是啊
[15:22.31]阿尔法four 确实是一个非常非常重要的进展
[15:24.65]它绝对是一个变革性
[15:26.13]是一个结构生物学
[15:27.35]甚至说
[15:27.83]像你讲到的
[15:28.65]它其实会有很大的商用价值
[15:30.57]包括像我刚才讲到
[15:31.85]其实从我们在技术领域域人来来的话
[15:34.29]和阿尔法
[15:35.33]呃 Zero
[15:35.93]阿尔法go 相比
[15:36.95]阿尔法go 它的商用价值是大的多得多的
[15:40.51]而且它解决的问题也是非常具有现实应用价值
[15:43.93]而且非常具有巨大的商业价值的
[15:46.42]没有 但是呢
[15:47.64]其实现在 呃
[15:48.88]还有很多问题
[15:49.88]虽然说阿尔法four 达到了最高的精度
[15:52.16]它达到的是最大大看到是是九十二点几
[15:54.82]但它毕竟还不是百分之百
[15:56.38]当然现在是不是百分之百
[15:57.94]还有一部分是说
[15:58.84]是不是我们ui 做测试的那些数据本身是不是存在实验误差
[16:03.06]但本身来讲
[16:04.00]它预测的结构并不是完美的
[16:06.10]它有很多其实需要进一步研究的地方
[16:09.88]包括就是它现在确定了一些
[16:11.92]比如说确定的角度
[16:12.94]确定距离
[16:13.66]但是它精确的位置
[16:15.02]比如说氨基酸测量精确的位置
[16:16.58]它实际上还是并不能够达到的
[16:19.62]所以我觉得在这个程度上
[16:21.44]大家一定还是要给技术有一定的耐心
[16:23.66]就像我刚才提到的
[16:24.88]本身它的发展也要依托于本身结构生物学它自己的发展
[16:29.18]我们拥有更多的高质量的这些蛋白质三d 结构的数据
[16:33.20]因为它本身实际上是一个deep learning
[16:34.96]是一个深度学习嘛
[16:35.90]更多这些高质量数据进去阿尔法four 的
[16:38.30]它实际上才会更加的精准
[16:40.10]才可以更快的进入商业化
[16:42.20]但是它一旦开始进入商业化的
[16:44.30]其实跟我们每个人的生活都息息相关关
[16:46.91]可能首先第一点就是药可能会更便宜
[16:49.43]其实是像我们平时的话
[16:50.73]为什么说药厂它有些药会比较昂贵呢
[16:53.93]并不是像大家经常想象的说
[16:55.67]药厂就一定是邪恶的
[16:57.27]像电影里去描绘的
[16:58.53]它去故意售高价
[16:59.61]是因为药厂在进行新药研发的过程中
[17:02.27]更期的一个新药研发的投入
[17:03.87]实际上不是以几亿美金为起点起始的
[17:07.21]它实际上是一个上十亿美金的这样的一个投入
[17:10.19]所以如果我们可以通过像阿尔法for 的这样的工具
[17:13.45]去进一步的首先缩减新药研发的时间
[17:17.57]同时呢
[17:18.21]降低新药研发的成本
[17:19.55]那我们将来
[17:20.23]当然我们每个人的就是获得药的成本也会大幅降低
[17:24.23]所以大家都会有更便宜的一个药
[17:26.11]就比如说包括一些像是脑部疾病
[17:28.93]像老年痴呆呀
[17:29.89]帕金森这样的疾病
[17:30.91]其实以现在也当然还有确定也是说可能会和在蛋蛋白折折叠程程出出了一一些问题而去导致的
[17:38.19]所以在另外一方的话呢
[17:39.39]会只是说制药还会帮助我们会更好的去理解一些我们现在无法理解的疾病的它的成因
[17:44.81]就到底是哪一部出现了问题
[17:48.04]导致了这样的一个疾病
[17:49.34]所以我们可以进行更好的诊断
[17:51.24]同时再去进行治疗
[17:52.30]那再往前推的话呢
[17:53.76]如果我们这个技术如此的高效
[17:55.90]而且大家也知道
[17:56.88]其实它针对每个蛋白质进行分析的话
[17:59.26]它可以做到更好的个性化
[18:01.04]其实包括括我们现在想的话
[18:02.72]那必然阿尔法的这样的技术也可以帮助我们更快的在延发问题
[18:07.46]甚至是个性化的疫苗
[18:09.34]因为本身疫苗它就是要去研究说这个病毒的蛋白质的结构到底是怎么样功能的
[18:14.84]我们才可以对症下药
[18:15.98]去找出一个疫苗可以去抑制它
[18:18.48]所以我觉得这个是啊
[18:20.62]可能跟大家非常息息相关的
[18:22.32]那如果还有一些更大的在延伸的话呢
[18:25.02]其实现在我们经常一个大的主题讲的就是全球的一个叫可持续性发展污染的问题
[18:31.08]那污染的问题很大的一个问题就是降解问题
[18:33.72]怎么样可以进行更好的降解
[18:35.86]垃圾降解
[18:36.72]石油降解
[18:37.18]因为这个其实也是我们啊
[18:38.86]因为我们材料性的话
[18:40.24]其实有一个方向是高分子方向嘛
[18:42.36]其实在这个方向上也做了很多问题
[18:44.40]所以其实这个也是跟蛋白质设计是很相关的
[18:49.21]如果可以通过阿尔法的去实现可生物降解酶的这样的一个进步的话呢
[18:54.05]就是有针对性的让这个生物降解酶
[18:56.73]比如说去针对这种特种塑料
[18:58.61]或者说是石油
[18:59.65]或者说是其他的特性的垃圾
[19:01.85]那这样的话
[19:02.39]我们就可以可以更加以生物形态的去分解和降解废物
[19:07.27]这样的话
[19:08.21]所谓的一个环境污染各方面就会会大大的降低
[19:11.71]所以其实我觉得所有的这些可能性
[19:14.03]未来都可以通过想加速我们整个结构生物学的一个发展去实现
[19:19.09]那阿尔法fofold 呢
[19:20.01]是在是就是一个像我提到的
[19:22.05]非常非常有利的一个非常有价值的一个工具
[19:25.81]可以去帮助我们加速解决这些问题
[19:29.05]然后加速的话
[19:30.23]去帮助我们解构更多的蛋白质的一个三d
[19:33.69]三d 的一个结构
[19:34.99]嗯嗯嗯
[19:36.17]所以
[19:36.45]Deep mine 它下面其实是分了好多不同的团队是吗
[19:40.35]就是
[19:40.63]就像阿尔法go
[19:41.41]阿尔法four 和这个阿尔a food
[19:43.05]还有其他的一些团队在研究不同领域的deep learning 吗
[19:46.51]嗯 其实有啊
[19:47.71]其实
[19:48.07]其实一方样
[19:49.17]他们整体上的模型都是说怎么样是深度学习习括括有各各各各样
[19:53.71]我们之前也讲
[19:54.43]就是reinforce 的这个learning 对吧
[19:56.43]还有deep learning
[19:57.45]各种各样的模型
[19:58.71]我觉得其实阿尔法food 一直是在工业界
[20:01.97]或者说各个领域去找到一个好的应用的一个切入点
[20:05.75]实际上就是他造的一个工具
[20:07.37]他希望找到一个应用的领域
[20:09.17]去试验这个工具
[20:10.19]而这个工具也会在试验的过程中
[20:11.99]在应用的过程中
[20:12.93]变得越来越高效
[20:13.97]越来越准确
[20:15.17]所以啊
[20:15.85]其实阿尔法four d
[20:16.75]你会发现现
[20:18.07]它是在阿阿法a
[20:19.25]阿法algo
[20:19.87]阿阿法a 的各种各样不同的名字
[20:22.15]实际上它本质上其实一个大的团队
[20:25.03]它要去核心要做的
[20:26.95]实际上还是他那个fodeep learning 的这个ine
[20:29.43]那另外外方面面
[20:30.79]我如果说说看一阿阿尔a 的的个团队队
[20:33.01]就像我刚才过程的
[20:34.27]它里面的人
[20:35.32]人才
[20:35.76]包括你看到他的
[20:37.02]呃
[20:37.32]文章里面的一作
[20:38.34]也都是非常非常杰出的各个背景的这样的一个科学家
[20:42.08]不只是人工智能科学家
[20:43.78]其实这就是我刚才讲到的
[20:45.88]这是也是我们现在看创新非常重要的一点呢
[20:48.62]就是跨学科合作啊
[20:50.04]我们能看到说这个各个领域的顶尖的人物
[20:52.76]人工智能的顶尖人物
[20:54.12]生物学家
[20:54.90]或构生物学家
[20:56.38]然后各种各样背景的
[20:58.14]然后数据工程师
[20:59.54]所有的人聚集到一起
[21:01.16]然后才可以把所有这些信息整合到一起去进行应用
[21:05.06]其实最早我开始投人工智能在医疗领域应用的时候
[21:08.18]我当时就发现
[21:09.28]这个领域最大的问题
[21:10.22]并不是说缺少应用场景或者缺少人才
[21:14.22]其实都有
[21:15.08]但的问题就是两边实际上在之前没有很好的沟通
[21:18.10]对对方有误解
[21:19.14]其实很多传统的生物学家很看不上有人人工智能做很多生物学相关的这些分析
[21:24.70]觉得他不够准确
[21:25.96]一些刚开始的一些人工智能的团队呢
[21:28.18]经常会提出一个所谓的vision
[21:29.92]就是我们要替代掉这些人
[21:31.76]包括最早的一些时候
[21:33.22]替代掉医生啊
[21:33.98]替代掉护士啊
[21:35.00]替代表结构生物学家
[21:36.81]所以两边就是形成了这样的一个对峙的状态
[21:40.29]但实际上
[21:40.89]如果双边开始合作
[21:42.09]就像阿尔法的这样
[21:43.29]把这些人集合到一起
[21:45.03]其实确实是互相赋能
[21:46.65]就像我讲的
[21:47.31]我们一直在聊阿尔法的对整体结构生物学的影响
[21:51.21]但是就像我提到的
[21:52.95]也是因为结构生物学它本身的发展可以去持续的在过去支持的阿尔法fofofour 的发展
[21:59.29]给它提供了非常充足的高质量的数据
[22:01.61]在未来也会持续的去支持它的发展
[22:04.03]就跟我们在互联网这些大数据的这些领域是一样的
[22:07.78]对我们有如有了很多的data 之后
[22:10.29]我们才能够来这个训练这个ai
[22:12.83]能够让大家才能用上这样的一个数据
[22:16.19]去做更多的这个发掘
[22:17.99]对
[22:18.15]我觉得应该就是相辅相成
[22:19.69]这个历史的这个进步的必然
[22:21.89]对 对
[22:22.73]而且其实我们现在还有很多问题需要去解决
[22:25.45]就比如说像阿尔法fold
[22:27.27]它提出了说他可以成功预测出来结构
[22:29.87]但是我们现在其实对于很多人工智能的算法
[22:32.63]还有一个大的问题
[22:33.51]就是他们们预测出来的这个方面
[22:36.62]这个规律
[22:37.14]实际上它是一个黑盒子嘛
[22:38.58]就是你要要可解释性
[22:40.76]所以这些东西其实并不是说单纯靠人工智能技术可以去解决的
[22:45.18]这个可能反向反而需要结构生物学家去从他们的角度再去验证
[22:49.84]说到底这边预测出来的验证了什么样的功能
[22:52.60]然后去把这个结构和功能性做一个更好的
[22:55.88]呃
[22:56.18]Correlation
[22:56.74]就是更好的一个连接和对应
[22:58.94]嗯嗯 唉
[22:59.90]我不知道
[23:00.38]你有这个仔细读他们的这个比赛
[23:03.08]我还不是特别清楚他们整个的一个比赛的一个流程是怎么样
[23:08.94]就是组织方给你出了一个题目
[23:11.16]然后大家去用不同的自己的算法去预测
[23:13.50]然后后面再分析谁的更接近这个命题
[23:17.34]是这样的一个过程吗
[23:19.16]对
[23:19.46]大概是这样的一个过程
[23:21.06]实际上他们就是会选择一些在过去几年也已经被就是通过我们讲说冷冻电镜最新结构出来的一些蛋白质来作为他们的一个考题
[23:31.32]他们的三d 结构
[23:32.34]然后呢
[23:32.76]就会有各种各样的团队来提交
[23:34.62]当然不是说都是一定要用人工智能的方法
[23:37.55]有各种各样的方法来去
[23:39.57]呃
[23:39.97]提交他们的这个对这个蛋白质三d 结构的预测
[23:43.43]基于他们这个氨基酸碱基啊
[23:46.15]碱基队它之间的这个排序
[23:48.21]包括其实你看今年参与的其实还有一些诺贝尔奖的获得者呀
[23:52.33]然后除了像
[23:53.49]呃
[23:53.79]谷歌参与的
[23:54.43]像微软啊
[23:55.29]这些大的公司
[23:56.35]好像中国也有企业参加啊
[23:58.59]还有一些很多学校去参加
[24:00.51]所以其实他参与的啊
[24:02.77]机构和背景都是非常强的一个团队
[24:06.03]那阿尔法的今年当然是非常出色
[24:08.47]他的领先程度还有准确率是最高的
[24:10.77]而且领先第二名很多
[24:12.35]好的
[24:12.83]那我觉得其实今年也是还没有非常神奇的一年
[24:18.16]然后我们其实在生物领域
[24:20.86]你投资或者是看到的一些串是有什么东西呢
[24:24.18]嗯
[24:24.72]其实我觉得
[24:25.58]其实我们今天聊阿尔法for 的就是一个非常好的切入点
[24:29.00]那阿尔法for 的就是一个非常好的代表
[24:31.34]是怎么样用文长的新技术就人工智能在医疗领域的应用
[24:35.48]在生物学领域的一个应用
[24:37.68]因为整体上这就是一个非常大的趋势
[24:40.58]因为从我们人体上来讲
[24:42.32]我们其实有很多
[24:43.74]无论是对我们自己本身的大脑
[24:45.84]对身体结构
[24:46.76]包括基础的细胞蛋白怎么运作
[24:49.16]还缺少很多的认知和解释
[24:51.76]它到底是怎么样去运作的
[24:54.22]那这个缺失也是因为我们之前实际上没有能力去收集这么多的人体的生理性的数据
[25:00.76]同时通过这些数据去挖掘这些价值
[25:03.42]所以我觉得现在一个非常好的一个时界点
[25:06.22]就是我们周围布满了这些低成本的传感器
[25:08.98]或者说是一些设备
[25:10.30]包括我们的手机
[25:11.38]而且这些传感器的价格都在不限的降低
[25:13.88]我们可以多维的去收集各种各样的这些数据
[25:16.77]然后呢
[25:17.13]再通人工工智能这样的工具去进行数据的优化
[25:20.69]筛选 选择 分析
[25:22.19]然后去进一步的去反向辅助我们在医疗层面上
[25:25.47]无论是诊断还是说是个性化治疗
[25:28.49]其实我们包括经常讲说癌症的一个最终的初估路
[25:31.83]它就是一个个性化的诊疗
[25:33.81]那怎么样能完成个性化
[25:35.37]那你必须要借助数据的力量
[25:37.93]还有人工智能的帮助才能够去完成
[25:40.99]所以它是一个整体结合的过程
[25:42.79]就是经常讲说
[25:43.59]不是用人工智能去替代
[25:45.07]而是说用人工智能去叠加在我们现有的这些医疗手段
[25:48.93]医疗器械之上
[25:50.03]所以这绝对是一个非常大的趋势
[25:52.39]也是我们一直在投的趋势
[25:53.89]我是从一七年开始投
[25:55.59]然后呢
[25:56.07]今年就非常明显感受到
[25:57.65]我投的所有这些人工智能在医疗领域的公司
[26:00.73]今年一年的无论是说它的收入增长
[26:03.53]融资增长
[26:04.55]甚至说退出各方面都非常非常的惊人
[26:07.41]是因为今年可能大家也是由于疫情的影响
[26:09.73]看到的这方面的一个迫切的一个需求
[26:12.57]如果说再去具体细分去看的话呢
[26:15.23]因为刚才这好也提到了一个
[26:17.20]就是跟结构生物学相关的
[26:19.14]我刚才提到说由于蛋白质折叠引起的一个疾病
[26:21.66]就是脑部疾病
[26:23.08]就帕金森老年痴呆
[26:24.54]实际上这也是我非常关注和非常希望看到更多技术应用的一个领域
[26:29.20]就是精神类疾病的在新技术方面的一个整合
[26:32.96]就是比如说我们经常讲到的帕金森老年痴呆
[26:36.04]尤其是老年痴呆
[26:37.10]还有其他的像比如说抑郁症这些
[26:39.80]呃
[26:40.24]其实我们以前没有很好的技术手段去对待这这类疾病进行持续性诊断
[26:46.16]因为大家可能经常想的
[26:47.72]所谓的诊断
[26:48.96]你是一次性诊断对吧
[26:50.46]你去看医生
[26:51.26]这次测一些东西
[26:52.40]然后告诉你是不是有得这个疾病
[26:54.02]但是脑部疾病
[26:54.92]比如说像老年痴呆
[26:55.92]你很难说
[26:56.52]我看你一下
[26:57.26]知道你有没有得老年痴呆
[26:58.74]它需要一个持续的一个监控
[27:00.80]然后信息的分析收集
[27:02.12]才可以进行很早期的诊断
[27:04.06]但现在我们就是有了这样的技术条件
[27:07.00]那除了人工智能之外
[27:08.26]我另外一个今年年初也在旧金山的这个jp morgan health care conference
[27:12.82]就医疗大会上
[27:14.02]我一七年是发的人工智能的报告
[27:15.72]今年我其实在演讲的时候
[27:17.37]讲的就是边缘计算
[27:18.77]那现在其实医疗领域还有一个大的挑战
[27:20.91]就是数据量非常非常巨大
[27:22.87]但是怎么样可以快速的进行啊数据的传输分析
[27:27.07]实时反馈
[27:27.79]其实边缘计算是非常关键的一个技术
[27:29.83]那现在这些技术都已经开始整合的话呢
[27:32.75]就可以帮助我们更好的找到各种疾病的相关性
[27:36.72]比如说对于老年痴呆
[27:38.56]对于特定的每个人
[27:40.18]到底他的发病成因是什么原因
[27:42.88]只有理解了他的发病成因
[27:44.62]我们才可以更好的去
[27:47.10]呃
[27:47.34]去进行个性化的一个治疗
[27:49.32]但这个脑部疾病
[27:50.62]可能在以前
[27:51.40]我们其实在这方面的发展是比我们对于心脑血管疾病和癌症关注的要少很多的
[27:56.98]但
[27:57.38]但是现在我们全球都在面临一个老龄化社会
[28:00.62]所以脑部疾病就是比如说就像老年痴呆这个疾病
[28:04.32]认知障碍这个病疾病本身就会成为一个全球非常大的一个问题
[28:08.58]而且它本身给社会福利包括保险带来的负担也是非常巨大的
[28:13.86]那在这个进境退步
[28:15.56]哈
[28:15.74]就是我也非常关注的一个领域
[28:17.98]尤其是人工智能在医疗的应用
[28:19.82]实际上是depression
[28:21.06]就是抑郁
[28:22.28]其实人的这些情绪抑郁这方面的
[28:25.08]就是我们叫disorder
[28:26.40]就是我也不知道中文怎么翻译过来
[28:29.02]它其实是也是一个黑盒子
[28:31.52]而且他每个人的成病的原因也都是比较有它的个性化的
[28:36.17]所以这些都是我们新技术可以去啊
[28:38.65]发挥非常重要影响力的一些方向
[28:41.85]嗯嗯
[28:42.47]如果我再追问一下
[28:43.75]就比如说是现在前沿的
[28:45.37]像我们在了解抑郁
[28:47.19]然后在了解
[28:48.17]呃 老年痴呆
[28:49.45]大家现在前沿的用的研究的方法
[28:51.77]或者大家的技术手段现在是什么样的呢
[28:54.51]嗯
[28:54.81]你是说就是新的技术还是传统的技术
[28:57.71]就是现新的技术
[28:58.99]就是你投资的
[28:59.87]或者是你看到大家现在正在研究的方向是什么样的呢
[29:03.15]呃 新的技术
[29:03.99]当然
[29:04.23]其实比最基本的
[29:05.63]就我我到的
[29:06.53]其实就阿阿尔法fod 一样
[29:07.92]它其实是把人工智能引入进来
[29:09.77]然后依托于现有的已经存在的收集的大量的这些生理性数据
[29:14.63]去进行相关性的联系
[29:16.63]去进行个性化诊断
[29:17.71]比如说发现说哦
[29:18.65]这个人得老年痴呆
[29:19.77]他很可能的原因是因为他经常抽烟
[29:22.09]那个人很可能是比如说基因的问题
[29:24.87]然后呢
[29:25.23]再和他其他的一些检测手段的结果去进行相结合
[29:28.49]所以它是一个辅助的一个方式
[29:30.61]同时的话
[29:31.19]我觉得就是因为我们可以通过人工智能
[29:33.43]还有包括这些低成本传感器进进你大量数据的收集
[29:36.76]我们可以进进行更好的建模
[29:39.18]所以可以进行更好的早期诊断
[29:41.28]也或者说早期诊断
[29:42.62]它有一定预防的一个功能嘛
[29:44.72]然后从可能大的社会的层面上的话呢
[29:47.08]你可能也可以对整体的这个比如说加州的这些人群做一个预判和预诊断啊
[29:52.50]然后有一个比如说从社会层面上
[29:54.88]政府层面上
[29:55.78]Regulation 的层面上
[29:56.90]监控监管层面上的一个预判
[29:59.54]所然这是比较多的
[30:01.66]现在看到人工智能的一个应用
[30:03.48]当然还有更加先进的技术
[30:05.16]就比如说像纳米机器人
[30:06.60]因为今年还有一个就是伊朗mask
[30:08.48]他不是发布了它那个脑机接口的公司嘛
[30:10.74]但其实它并不是这个领域做的第一家公司
[30:13.44]像科ll 前一年也是做的很不错
[30:16.02]我们投的一家公司叫parwer domics
[30:17.98]这是这领域的第一家公司
[30:19.78]它一五年就开始做了
[30:20.96]也是拿了国防部就大量的就是这种免费的funding 的资本在做应用
[30:26.30]那这可能就是更多的早期诊断
[30:29.30]它其实是用这种纳米纤维驱动的纳米机器人
[30:33.20]然后植入到大脑之后
[30:34.42]用纳米纤维重建脑神经递质的传递
[30:37.42]通过重建脑神经质地的传递
[30:39.52]实际上不就可以修复部分脑损伤吗
[30:42.56]就比如说像帕金森
[30:43.78]其实它就是有一部分脑
[30:45.32]大脑的一部分
[30:46.04]它变灰色了
[30:46.82]它脑神经递质的传递停止了
[30:49.02]以前的很多你就其实已经失败的药
[30:51.62]它的目的是想去刺激那部分重新进行信息传递
[30:55.66]但是做不到
[30:56.50]但是我刚才讲的这样的纳米机器人的技术
[30:59.08]它其实比较简单直接就是像你心脏搭桥一样
[31:02.54]你这边不通过
[31:03.34]我给你再搭一个
[31:04.62]同时它在修复脑损伤的同时
[31:07.24]重建脑回路的同时
[31:08.76]它其实也形成了一个接口嘛
[31:10.84]我们以前其实很大的一个问题是怎么样去理解我们的大脑的神经网络运作的
[31:16.72]信息怎么传输的
[31:18.02]是很难去有一个孔
[31:20.20]就是全面的一个信息收集的
[31:22.22]一方面是说
[31:23.00]你知道我们大脑中的这些它神经元在去运作的时候
[31:26.62]它实际上是一个就像布脑运动一样
[31:29.10]它是说说单线程的
[31:30.44]或双双程的
[31:31.37]他是很random
[31:32.25]他是来回来去走的
[31:34.29]但是呢
[31:34.79]我们计算机去处理数据的时候
[31:36.55]它是单线程的
[31:37.55]所以有了像这种纳米机器人的这样的一个端口之后的话呢
[31:41.05]我们可以把这些信息收集了之后呢
[31:43.15]通过我们中间一个处理器
[31:44.95]Cmos 处理器
[31:45.85]把它处理成单线程的数据
[31:48.25]去让机器去进行读取
[31:50.38]这样的话
[31:50.87]其实也是一个数据处理的过程
[31:52.97]也就是大家经常理解的说所谓的脑机接口
[31:55.25]你包括今年医疗mass
[31:56.69]他不是宣布他们那个当时在judian 上
[31:58.67]他们带宽能处理多少信息嘛
[32:00.51]我们投的那家公司por jourmes 在三年前实际上处理信息能力已经是他们的大概四倍左右了
[32:06.03]所以这些的发展都会让我们更好的去分析收集
[32:10.33]然后去理解大脑脑怎怎样运运作
[32:13.27]我们们只有更好的确确理解解了这个脑脑怎怎么运作
[32:16.79]我们才可以对症下药的去理解解底底哪步步错了
[32:20.21]才会导致某种疾病
[32:21.93]然后去试图的去修复它
[32:23.85]我觉得现在可能大家很多人的关注点还在癌症上
[32:27.71]是因为癌症症听来来可怕
[32:29.61]怕来了之后来来来势汹汹
[32:31.77]但是真的我们要从宏观的角度讲的话呢
[32:34.86]去看整体的人口基数
[32:36.78]还有说未来老龄化社会的这个趋势
[32:39.38]脑部疾病
[32:40.04]神经类比疾病
[32:40.84]尤其像老年痴呆这类的几名会是我们非常非常巨大的一个挑战
[32:45.54]是的 是的
[32:46.28]我其实我们
[32:48.18]我家
[32:48.62]然后还有我身边的一些朋友
[32:49.98]我觉得这个比例现在是越来越长了
[32:52.08]因为大家其实现在的这个寿命是越来越长的
[32:55.00]我们现在不关心这个话题的话
[32:56.80]那可能后面对的我们没有办法应对整个逐渐变老龄化的这个整个全球的社会
[33:03.42]其实我看你这个今年大概投了大概能有九十九个项目
[33:07.74]十个项目
[33:08.42]所以大概这个方向你是在往哪个方面看的
[33:11.34]我们刚刚聊了像是这种可能depression
[33:14.28]还有精神类疾病这些方面的一些创业公司
[33:17.28]然后你今年还出手了一些什么样的项目呢
[33:20.42]嗯
[33:20.68]今年我一共是其实到目前投了七个项目吧
[33:23.52]我觉得除了医疗之外的话
[33:25.10]其他一个重要的方向
[33:26.34]我投比较多的
[33:27.30]其实还是相关于数字化转型
[33:29.66]就我们一直在投这工业和企业的数字化转型
[33:32.78]当然今年由于疫情的加速
[33:34.64]大家都必须要做数字化转型
[33:36.36]所以也推进了很多传统统业在这个方面的技术的应用整合
[33:40.60]当然是一个重要的转型
[33:41.86]但是我觉得除了就是直接处理数据之外
[33:44.52]我们可能也布局了一些非常好的和网络相关的
[33:48.44]还有就比如说这网络技术相关
[33:50.34]像边缘计算这方面的
[33:51.66]也在持续布局
[33:52.82]另外一个的话呢
[33:53.98]包括其实今天我们聊之前
[33:55.74]我刚才在跟团队开一个会
[33:57.22]我们在做我们新一轮的行业报告
[33:59.31]其实针对的还是说数据安全的问题
[34:01.71]因为现在其实另外一个比较火热的话题
[34:03.99]大家经常在讲的就是科技的一个监管嘛
[34:07.45]对于大型科技企业的一个监管
[34:09.51]但其实在我看来
[34:10.71]这个监管最核心的部分
[34:12.73]实际上是对数据的监管
[34:14.87]嗯
[34:15.07]我们经常讲科技企业的所谓的垄断
[34:17.15]我觉得它的核心是数据垄断
[34:19.39]所以这个数据垄断
[34:20.69]它需要技术去解决
[34:22.39]它也需要监管去解决
[34:23.71]它无法通过单一的一个方式去解决这个问题
[34:26.99]我觉得这是一个趋势
[34:28.13]而且它是一个必然会到来的趋势
[34:29.99]无论将来我们是监管的角度
[34:32.31]还是技术的角度
[34:33.09]我们必须解决它
[34:34.25]而且它也不只是一个科技领域的一个问题
[34:36.97]因为我们自己建了一个cxo 网络
[34:39.11]已经好几年了
[34:40.29]在这个网络里
[34:40.95]我们大概有大概三十二个都是美国这种就是一千强企业里面的c level
[34:45.93]就是他们的首席技术官或首席数据官
[34:48.67]就比如说像target
[34:50.05]你知道target 美国这种连锁的传统的超市
[34:53.19]包括一些美国传统的这些大型的企业
[34:56.17]他们都开始设一个新的职位
[34:57.75]叫首席数据观
[34:59.42]因为它意识到数据的重要性
[35:01.40]我觉得现在大家都必须要有一个基本概念
[35:03.76]就是数据是资产
[35:06.19]数据可能是我们未来最有价值
[35:08.21]最快增长的资产
[35:09.37]那对于企业和公司也是一样
[35:11.59]那他们也想去更好的去抓住数据的价值
[35:15.33]抓住资产的价值
[35:16.27]但同时也要保护他们自己
[35:18.21]所以像我其实今年跟他们很多的这种讨论
[35:21.25]他们经常在问我的就是跟数据监管相关的
[35:24.31]因为一方面他们有海量的数据
[35:26.21]他们从来没有用过
[35:27.23]但是他们现在开始数据了
[35:28.63]又担心未来如果监管的话呢
[35:30.59]他们怎么样可以通过技术解决方案去规避自己的潜在的风险
[35:34.71]还有连带责任
[35:36.15]所以我觉得针对这些数据的
[35:38.40]无论是说他的处理
[35:40.19]脱敏
[35:41.19]怎么样去定义数据的所有权
[35:43.79]去进行更好的数据追踪
[35:45.85]这也是非常非常关键的一个方向
[35:47.93]而在这些方向里面
[35:49.49]拥有最大量最高质量数据的领域就是医疗
[35:53.49]其次就是保险
[35:55.03]所以这也是为什么他又回到了说实际上也是跟医疗领域紧密相关的一个方向
[36:00.71]其实很多
[36:01.57]包括我们就是之前讲说
[36:03.37]为什么阿尔法zero
[36:04.07]阿尔法go 引起那么大的轰动
[36:06.76]或者说大家的关注
[36:07.92]但其实阿尔法fold 是有更强的商业价值
[36:10.18]反倒可能大家的关注点没有那么多
[36:12.22]也是因为可能阿尔法zio
[36:13.82]阿尔法go 它以围棋这样一个大家好像都马上能够理解和切入的点
[36:19.18]去展现了它的一个应用
[36:21.20]但是阿尔法fold 呢
[36:22.30]确实 呃
[36:23.38]可能如果没有一定的背景知识
[36:25.28]大家看不到这个技术的革命性
[36:27.98]它的关键性
[36:28.88]和它未来会对我们整个各个产业还有生活的一个影响响
[36:33.40]但实上上
[36:33.88]我觉得这个一一解解释
[36:35.12]其实能让大家看到
[36:36.86]为什么这个技术非非非常关键的
[36:39.00]而且这个进展对于整个就是只是我们单纯讲说学术层面的结构生物学
[36:43.80]而是所以我们整个各个商业层面的应用
[36:46.62]都是一个非常大的一个进步和推动
[36:49.46]包括其实我们本身
[36:50.82]其实看到这个消息是非常非常激动和高兴的
[36:54.44]因为很多的以前我们看到说
[36:57.34]包括我一直为什么不太碰
[36:59.40]就是说生物制药这个领域就是因为它在早期的研发的需要投入的时间
[37:04.78]还有包括它需要投入的资产的量
[37:07.65]其是太巨大了
[37:08.65]所以对于一个基金来讲的话
[37:10.17]我需要考虑说它的投入
[37:11.75]还有说产出
[37:12.69]包括说将来的一个退出的一个时间
[37:14.99]但是如果像阿尔法four 的这样的技术开始做商用化
[37:18.19]实际上这个研发的周期会大大减短
[37:20.39]其实对于我们这样的vc 来讲的话
[37:22.18]我们可能也就会更愿意在这个方向去进行更多的一个资本投入
[37:26.13]以前现在实际上更多还是说大资本
[37:28.49]甚至说药厂在这个方面的投入
[37:30.61]但未来很可能也会打开
[37:32.87]呃
[37:33.07]资本的多样性
[37:34.27]参与者的多样性
[37:35.51]所以就更能激发更多一些新的创新的技术通过这样的一个驱动区涌现出来
[37:40.91]所以我觉得真的是非常值得就是大家关注的一个技术
[37:44.81]只是说可能现在没有看到大家像关注阿尔法购那样关注阿尔法four 的
[37:48.79]对对对
[37:49.29]就是有的时候
[37:49.95]大家没有在自己脑海里面就是形成一个对标的东西
[37:53.39]因为大家都知道围棋
[37:54.95]对
[37:55.07]你说我们大家作为一个包on dynamic
[37:57.81]然后有一个特别这个好的视频给大家看到话
[38:00.75]这个牛逼
[38:02.43]但是你如果再讲到这个alpha four 的
[38:04.83]就你像翻两下
[38:06.03]你稍微再解释一下什么叫做蛋白质折叠
[38:08.79]你再解释一下什么是这个冷冻电竞
[38:11.07]然后大家就已经已经完全lost 掉了
[38:13.65]对 嗯
[38:14.33]所以我觉得给大家有一个这样的对标
[38:16.61]是我觉得能给让大家能重视起来这个东西吧
[38:21.07]我们都在这个风投圈或者是科技圈嘛
[38:23.41]其实看多少人转发了
[38:24.71]其实是聊寥无几的的
[38:26.23]就完全不像是当时可能alpha go 大家完全就刷了屏了
[38:30.01]对 是的 是的
[38:31.59]那好的
[38:32.51]我们今天谢谢张璐来做客我们的节目
[38:34.77]帮我们这个深入浅出的聊一聊这个alpha four 然后是什么
[38:39.15]然后同时我们未来可能会有什么可期的在商业上面的应用
[38:44.05]非常感谢张璐帮我们做了这么精彩的解释
[38:47.11]好的 谢谢
[38:47.81]谢谢丁奖
[38:48.31]谢谢
[39:00.26]今天的节目就到这里
[39:01.58]这期节目除了主播和嘉宾
[39:03.48]也感谢我们团队的迪卡
[39:05.10]布里辛
[39:05.64]陈太太和look
[39:07.45]他们在最短的时间内完成了节目后期的制作
[39:10.63]也感谢小爱
[39:11.71]他是每次将音频上传到各个平台的人
[39:14.81]他同时也是申小英这个账号背后的小伙伴
[39:18.11]同时也感谢紫珊和amanda
[39:20.43]他们每次都将音频整理成文字
[39:22.85]并发布到我们的微信公众账号上
[39:25.81]如果大家想要长期关注我们
[39:27.51]也可以订阅我们的微信公众号
[39:29.73]搜索生动活泼这四个字就可以找到我们
[39:33.07]声是声音的声
[39:34.73]也请支持我们
[39:35.85]例如在您所收听的音频平台上点赞打分
[39:39.53]或者通过打赏的方式支持我们
[39:41.95]打赏方式在我们的微信公众号以及网站声刀fm 上都能找到
[39:47.43]Sheng 到fm
[39:49.93]当然也可以转发给你一两位朋友们
[39:52.33]让他们也听到这档节目
[39:54.13]也请大家继续关注我们之后的报道
[39:56.43]那我们下期节目再见
文本歌词
本字幕由TME AI技术生成
本节目由生动活泼制作播出
Hello
大家好
我是丁教
欢迎收听今天的硅谷早知道
十一月三十日
Alpha four 的系统在在第四四国际蛋白质结构预测竞竞赛casp 夺冠
平均拿下九十二点四的中位数的高分
这个竞赛其实是九四年由美国马里兰大学的约翰
穆尔特和同事们发起的
比赛的目的是比较计算机预测的蛋白质的结构和实验室的结果
得分如果在九十分以上
就可以认定为与实验室结果一致
相比于第一次出现在大家视野里的alpha four
大家可能对google deep mine 的alpha go 是非常熟悉了
Deep man 我们再重新说一下
它是一家英国的人工智能公司
公司创立于二零一零年
在四年后被谷歌收购
Deep man 创造了一个以重新的一式学习如何玩电子游戏的人工神经网络
并且这个神经网络可以介入一个外部的存储器
就像一个传统的图灵机一样
使得一台电脑可以模拟人类的短期记忆
很多人一看到这种晦涩难懂的生物名词和奇奇怪怪的三d 蛋白质模型
对这个话题望而却步了
我一开始也是这样的
但是我们不能忽视阿尔法four 的研究成果对于我们的长远意义
蛋白质折叠是生物学最大的三个未知问题之一
首先
它关系到代代相传的遗传信息到底是怎么指导生命活动的
其次
它有很强的应用价值
因为绝大多数的药物都是通过结合特定蛋白质来起作用的
如果我们能搞清楚蛋白质的分子怎么折叠
三维的结构长成什么样子
我们就能够更方便的设计出来药物来治疗疾病
所以本期的硅谷早知道我们就来深入浅出的聊一聊尔法alfour
以及我们为什么要关注和了解这个领域
今天我们的嘉宾是张璐
他在二零一五年成立了自己的基金fusion fund
这家基金在硅谷专注于高科技行业以及医疗行业的中早期投资
也是我们硅谷早知道的老朋友了
Hello 张璐
欢迎再次来到我们的硅谷早知道
林江 你好
大家好
欢迎来到生动活泼传媒旗下硅谷早知道第四季
这个世界因科技创新而巨变
那就请和我们一起在最前线观察科技创新所带来的变化
影响和机遇
嗯嗯
所以 张璐
能不能帮我们通俗的聊一聊蛋白质折叠到底是什么一个东西呢
嗯 好的 丁佳
你好 大家好 嗯
确实
其实阿尔法go 的像你讲到的
并没有说像阿尔法狗和阿尔法zero 之前引起了那么多公众的啊一个关注
但实际上从我们无论是说做技术
做科技投资
还是做学术的角度来讲
其实它的无论是说在科研上面的贡献
甚至说在未来技术转型商业化的贡献
实际上可能比阿尔法狗和阿尔法zero 都要巨大
那你刚才问到说怎么样通俗的去解释这个蛋白质折叠
我可能也就是通俗的给大家大家解释一下
其实蛋白质折叠它是啊
就是我们经常讲说有生物学家
生物学家中还有结构生物学家
这一类是结构生物学里面一个非常核心的一个挑战
也是非常重要的一个领域
首先就大家对蛋白质应该很熟悉对吧
我们身体的组成部分就是蛋白质
很多生物的生物体的组成部分也是蛋白质
而蛋白质折叠实际上就是在蛋白质的一个三d 的一个空间的一个结构
而这个空间结构去决定了蛋白质它本身的各种各样的功能还有性能
我们拿人来举例的话
我们身体中实际上是有就是十几万种的一个蛋白质
那大家都知道
蛋白质它基本组成单元就是我们经常讲的氨基酸嘛
大家经常讲说吃什么东西里面有什么氨基酸
那自然界它一共的氨基酸种类是二十种
那我们如果再细的讲的话
说氨基酸它是怎么样去形成蛋白质的
因为氨基酸其实我们就想说
如果我们把人身体看成一个大的机器
那蛋白质呢
就是一个一个的零件
氨基酸呢
就是连接
就是组成你像一个一个非常小的那个部件
或者说是particle
那蛋白质它最基本的过程是氨基酸
氨基酸它最基本呢
其实上就是通过一个肽链的方式去连接
所以我们就可以想象一下
我们有二十种天然氨基酸
这些氨基酸呢
它会进行各种各样方式的连接
它通过肽链连成了一个线性的多肽链
就像一串项链一样
那你一样把这样一个一个氨基酸通过像项项链的形式连成一链链之的话呢
是不是是它的组成它的顺序会不一样
由于比如说在这这样的一项链链里面
它穿的这些氨基酸的种类或顺序不一样呢
它就会让这个氨基酸的形成的这个多肽链呢
形成不同的折叠
它可能会形成各种空间角度的折叠
那在这个折叠的过程中
形成的这个过程就叫我们讲的蛋白质折叠
由于这样的折叠
最后形成的具有特定的三维空间结构的蛋白质呢
就是蛋白质的结构
而这些不同的结构呢
又决定了这些蛋白质它不同的一个特性和不同的一个功能
甚至说
大家讲
因为我是在斯坦福大师学科
我是学材料科学工程的
我们当然就很多分子结构啊
原子结构
我们经常比如说给大家举一个例子
像异构体
异构体就是说
你看它的分子式是一样的
但它其实三体空间是不一样的
其实对蛋白质也是类似
就哪怕说你连在这个一个项链上面的这些
就是这几种种类的氨基酸是一样的
但它们的排列顺序不一样
它的折叠方式也会不同
而且加的这个折叠是三d 的三维的一个折叠
所以也就是说
它的排列组成可以有各种各样的一个可能
不是一个简单的说
我们将算概率
说cc 级的这样的一个概率率以这就是为什么这个领域域它非常的复杂
包括说为什么蛋白质折叠是这么这么样的功个在结构生物学的一个命题
嗯嗯
那为什么大家需要研究蛋白质折叠
我们在科学上面是通过蛋白研究蛋白质的折叠能够达到什么么样的一目目标呢
嗯
因为其实就是我刚才的蛋
蛋白质结构
尤其它
它个三d 结构呢呢
它决了了它够做什么样样功能能就比如说
我其实身体里有各种各样的蛋白质嘛
那它的每个蛋白质特定的功能是决定于它独特的三d 结构
比比说说
我们经常讲我们这个免疫系统
我们会有抗体
他的这结结构呢
是有点像我们这个字母y 一样的形状的
那它这个形状也就决定了它能有什么样的功能是一个对应的
那比如说像我们经常女生讲的这个胶原蛋白对吧
胶原蛋白流失胶原蛋白
它就像一个绳子的形状一样
然后它也是有一个特定的结构
包括我们现在讲说copy n iting
对吧
冠状病毒
然后怎么样去发掘它
到底这个蛋白会形成什么样的作用
我们也是要从结构的角度去入手
我们理解了它如何折叠
形成怎么样的结构
我们就可以预测说
哦
原来它可能是这样的这样的功能
那我们在针对这个病毒
无论是去研究怎么消灭它
或者说是疫苗的时候
才能够更加更加的有效
所以这也是为什么说这是一个关键核心
也是一项非常非常复杂的任务
呃
实际上可能很多大家也都有听到
最早的就是由我们这个基因序列来去推断预测蛋白的三d 结构呢
是在其实是很多年前
大概我记得是七二年的时候
当时有一个诺贝尔化学奖的一个得主
他当时就是提出了这样的一个构想
因为他觉得他提出的构想就是说
在蛋白质
我刚才提到了
它首先是由氨基酸连连成的一个项链对吧
然后这个项链由于它的排列还有种子类
然后进行折叠
他提出说
这个氨基酸排列的一个这个序列
它能够决定它的一个三级结构
所以大家提出了这个设想之后
就有很多的结构生物学家在这个方向上去进行探索
所然可能大家第一个想到的就是一个穷举法
但是我刚才也给大家解释了
就是如何折叠的
如果用穷举法的方式去探索
那就是无穷无尽
但是现在实际上阿尔法的让大家觉得非常兴奋的一点
其实就是用深度学习的方式
用建模的方式
其实是一种更更聪明和更高效的方式去进行更加精准的一个预测和判断
嗯
所以我看到很多文章也是说
是不是这个阿尔法fofour 出来之后
大家蛋白质结构科学家就要失业了
嗯 呃
我觉得其实这也是
怎么说呢
这个就跟我们整体上去聊很多人工智能在医疗领域的应用应用一样
因为我其实一直在投的也是人工智能在医疗领域的应用嘛
其实我觉得不管是说我们阿尔法four 的这个例子
还是说其他的一些人工智能在整个医疗领域的应用
它现在在现阶段
它主要的一个功能还是赋嘛
甚至说我们在赋能
在进一步说解放
就是进行效能提升
它是一个非常有效的工具
去进行更加好的一个效能提升
去解决一个步骤的问题
但是生物相关的各种各样的问题
它其实是非常非常复杂的
那而且其实包括我们讲说阿尔法four 的为什么现在效以取得
因为它一八年就参加了比赛
包括前一段三月份
他有提出当时对于冠状病毒的各方面蛋白结构的一种预测嘛
虽然说那个预测结果也很好
但是当时我觉得很多人没有关注他预测准确的那个几个很准确
但他剩下那些就很离谱
就是差的很大
到现在对次参加比赛的这个准确率进一步的提升
当然一方面是他算法的一个提升
但另外一方面也是因为
呃
本身基础的这些就是结构生物学的研究
包括说我们现在已知的这几万个蛋白质的模型的这些数据的进一步的增加
还有包括他团队里
实际上你会看到有很多很多非常顶尖的结构生物学家去进行这种跨学科的信息的一个整合
我觉得这是一个关键
所以回到你
就是最初的问题
到底说 呃
这些科学家会不会失业
我觉得是
我觉得是不会失业的
我觉得其实是像我提到的
用人工智能作为一个工具
去帮助他们进行更有效的蛋白质结构的一个判断和预测
同时的话呢
也可以让生物学家
比如说可以进一步的推动他们在一些领域的进一步的一个研究
或者说
我觉得就比如说现在阿尔法fold 是取得了非常好的一个成绩
他可以去很精准的预测这些蛋白质的结构
但是另外一方面
其实还有很多一些关键性的啊问题没有被解答
或者说暂时或以后也很难去被阿尔法go 去解答
因为比如说
为什么就是这个结构会导致这样的功能
对吧
那导致这样的功能之后
再进一步怎么样去做
所以我觉得从这个程度上来看
我并不觉得结构生物学家会失业
那它可能阿尔法狗在某种程度上
它可以替代比较简单的蛋白质的结构生物学
但是我们真正的结构生物学家
它做的不是简单的蛋白质的结构生物学
它有更多更复杂的结构去等着一个解析
而且阿尔法狗在短期也不可能替代实验
因为在生物学的实验中
它其实蛋白质功能才是最重要
结构是一个中间的一个变量
它很重要
但是我们理解结构之后
我们还要理解后面的一个从动力学的角度去理解
说到提它这个蛋白质功能是怎么样去实现的
所以我觉得这是一个非常重要的一个切入点
当然还有很多其他的方面
简而言之
就是它实际上是一个加速
是一个赋能
但是它不会是一个替代
其 嗯
我能不能这么通俗的理解
哈
就有点像我们可能吃中药一样
其实我们这么多年
几千年年来总结出的经验
我吃这个
我它就是的
然后就等于说是
我们现在其实我们知道这样的蛋白有这样的功能
但是它的结构怎么样
原理怎么样
它跟它最后的结果是怎么样
我们其实不知道这个联系在哪儿的
对对对 是的
是的
另外的话
其实你想
我们每次聊到人工智能
要到深度学习
其实它的核心是什么
它核心还是需要大量的高质量的数据
所以你看我这里面两个核心的就形容词
一个是说数量要大
另外一个是质量要高
但现在我们实际上已有的生物数据的质量和数量都还远远不够
而我们现有的这些
就是这些数据
实际上是来自于现在已有的这些实验手段的
所以我觉得这两个一定是相辅相成的
当这些比如说像冷冻
电进这种实验手段更多的去结构出更多的新的更多质的数据
这些数据会反向来服务阿尔法的
让它变得更加准确
但同时的话
阿尔法worfofood 也会给出更好的一个预测
其实帮助啊
这些科学家去缩短他们整个在实验过程中的
呃
时间的损耗
包括在尤其是说资金的投入
其实每次结构生物学家去解构一个蛋白质过程
实验成本
各方面的成本是很高的
所以我觉得这两个是相辅相成
相互赋能的一个阶段
嗯嗯嗯
能不能给大家通俗讲一讲
冷冻电镜是什么东西啊
嗯
我其实也不知道怎么样可以去跟大家从头讲说什么是冷冻电镜
冷冻电镜
它全称应该是要冷冻的电子显微镜
通过冷冻电镜
实际上是希望可以通过温度
其他各方面的参数的控制
可以取更更加以原形的方式去保持蛋白质它本身的一个初始的形态
这样才可以在它不受损伤的基础上
去研究它的一个结构
所以冷冻电镜是我们现阶段就是在
呃
实验中很多去应用来去解构蛋白质的一个结构
三d 结构的
那除了冷冻电镜之外
当然还有大家经常听到的
像我们材料也经常用的
像是xrd 对吧
Xrd 用的也很多
另外就mi 是那个核磁共振
这个也用了很多
所以实际上是通过各种各样的方式
有一维 二维
三维的方式
各种这样啊
Imagine 就是成像的这种方式
去解构蛋白质三d 模型
嗯嗯嗯
所以我不知道这个能不能给大家一个可能
在概念上
就传统我们可能确定一个蛋白质它的结构
比如说是用冷冻电竞大概是需要多长时间
然后有了这个alpha four 之后
我们大概是可能把这个效率能够提高多少的
嗯
我觉得这个过程中
一方面像我刚才提到的
你看
你要使用像冷冻电镜
核磁共振
Fxrd 这些时间技术
它本身就是有很多时间上的损耗
所以在这个过程中
它际上是一个实验验过程程
实验过程程一定会出现蛋误
这个个错误
可可能有时间误误
也有人为错误
所以这个过程有需要很长一段时间
所以很多时候
每个蛋白质解构的一个成本
有些甚至可能需要花费很多时间
但大家想想
有多少蛋白质
每个蛋白质就要花费每个单计算单位的时间
所以它的成本也是上十万美元的这样的一个成本
所以它无论是时间还有资金的消耗都是非常巨大的
那生物学家想利用人工智能这个方法呢
也是因为这个过程实在是太低效了
而且是非常非常的昂贵
所以如果是像阿尔法fold 的话呢
其实他们的时间就可以大大的缩短
首先成本当然大大缩短了
这个就毋庸置疑
他不需要去画这个实验的过程
但同时的话
时间层面上也可以大大缩短上
比如说几周
甚至说可能复杂一点
它这个也是有一个range
从天数到周数
到月数
都是有的
但是基本上跟以往相比的话
要大大的提升
至少说
我们如果是从年到月的一个跨度
大概是十倍以上
甚至是二十倍
五十倍以上
那还是这很大的一个科学的一breakbreakthrough
是的 因为
因为这个领域其实还是蛮深蛮这个前沿的
因为我自己其实看了好多篇文章
也都是非常的摸不着头脑
所以我就觉得
就科学解决的这个是很大的一个breakthrough
但对于普通人来说的话
那它到底意味着什么
我们能够期待他们在商业上面很快的有应用嘛
嗯 我觉得
其实就
首先我觉得大家还是要理解一点
就是啊
阿尔法four 确实是一个非常非常重要的进展
它绝对是一个变革性
是一个结构生物学
甚至说
像你讲到的
它其实会有很大的商用价值
包括像我刚才讲到
其实从我们在技术领域域人来来的话
和阿尔法
呃 Zero
阿尔法go 相比
阿尔法go 它的商用价值是大的多得多的
而且它解决的问题也是非常具有现实应用价值
而且非常具有巨大的商业价值的
没有 但是呢
其实现在 呃
还有很多问题
虽然说阿尔法four 达到了最高的精度
它达到的是最大大看到是是九十二点几
但它毕竟还不是百分之百
当然现在是不是百分之百
还有一部分是说
是不是我们ui 做测试的那些数据本身是不是存在实验误差
但本身来讲
它预测的结构并不是完美的
它有很多其实需要进一步研究的地方
包括就是它现在确定了一些
比如说确定的角度
确定距离
但是它精确的位置
比如说氨基酸测量精确的位置
它实际上还是并不能够达到的
所以我觉得在这个程度上
大家一定还是要给技术有一定的耐心
就像我刚才提到的
本身它的发展也要依托于本身结构生物学它自己的发展
我们拥有更多的高质量的这些蛋白质三d 结构的数据
因为它本身实际上是一个deep learning
是一个深度学习嘛
更多这些高质量数据进去阿尔法four 的
它实际上才会更加的精准
才可以更快的进入商业化
但是它一旦开始进入商业化的
其实跟我们每个人的生活都息息相关关
可能首先第一点就是药可能会更便宜
其实是像我们平时的话
为什么说药厂它有些药会比较昂贵呢
并不是像大家经常想象的说
药厂就一定是邪恶的
像电影里去描绘的
它去故意售高价
是因为药厂在进行新药研发的过程中
更期的一个新药研发的投入
实际上不是以几亿美金为起点起始的
它实际上是一个上十亿美金的这样的一个投入
所以如果我们可以通过像阿尔法for 的这样的工具
去进一步的首先缩减新药研发的时间
同时呢
降低新药研发的成本
那我们将来
当然我们每个人的就是获得药的成本也会大幅降低
所以大家都会有更便宜的一个药
就比如说包括一些像是脑部疾病
像老年痴呆呀
帕金森这样的疾病
其实以现在也当然还有确定也是说可能会和在蛋蛋白折折叠程程出出了一一些问题而去导致的
所以在另外一方的话呢
会只是说制药还会帮助我们会更好的去理解一些我们现在无法理解的疾病的它的成因
就到底是哪一部出现了问题
导致了这样的一个疾病
所以我们可以进行更好的诊断
同时再去进行治疗
那再往前推的话呢
如果我们这个技术如此的高效
而且大家也知道
其实它针对每个蛋白质进行分析的话
它可以做到更好的个性化
其实包括括我们现在想的话
那必然阿尔法的这样的技术也可以帮助我们更快的在延发问题
甚至是个性化的疫苗
因为本身疫苗它就是要去研究说这个病毒的蛋白质的结构到底是怎么样功能的
我们才可以对症下药
去找出一个疫苗可以去抑制它
所以我觉得这个是啊
可能跟大家非常息息相关的
那如果还有一些更大的在延伸的话呢
其实现在我们经常一个大的主题讲的就是全球的一个叫可持续性发展污染的问题
那污染的问题很大的一个问题就是降解问题
怎么样可以进行更好的降解
垃圾降解
石油降解
因为这个其实也是我们啊
因为我们材料性的话
其实有一个方向是高分子方向嘛
其实在这个方向上也做了很多问题
所以其实这个也是跟蛋白质设计是很相关的
如果可以通过阿尔法的去实现可生物降解酶的这样的一个进步的话呢
就是有针对性的让这个生物降解酶
比如说去针对这种特种塑料
或者说是石油
或者说是其他的特性的垃圾
那这样的话
我们就可以可以更加以生物形态的去分解和降解废物
这样的话
所谓的一个环境污染各方面就会会大大的降低
所以其实我觉得所有的这些可能性
未来都可以通过想加速我们整个结构生物学的一个发展去实现
那阿尔法fofold 呢
是在是就是一个像我提到的
非常非常有利的一个非常有价值的一个工具
可以去帮助我们加速解决这些问题
然后加速的话
去帮助我们解构更多的蛋白质的一个三d
三d 的一个结构
嗯嗯嗯
所以
Deep mine 它下面其实是分了好多不同的团队是吗
就是
就像阿尔法go
阿尔法four 和这个阿尔a food
还有其他的一些团队在研究不同领域的deep learning 吗
嗯 其实有啊
其实
其实一方样
他们整体上的模型都是说怎么样是深度学习习括括有各各各各样
我们之前也讲
就是reinforce 的这个learning 对吧
还有deep learning
各种各样的模型
我觉得其实阿尔法food 一直是在工业界
或者说各个领域去找到一个好的应用的一个切入点
实际上就是他造的一个工具
他希望找到一个应用的领域
去试验这个工具
而这个工具也会在试验的过程中
在应用的过程中
变得越来越高效
越来越准确
所以啊
其实阿尔法four d
你会发现现
它是在阿阿法a
阿法algo
阿阿法a 的各种各样不同的名字
实际上它本质上其实一个大的团队
它要去核心要做的
实际上还是他那个fodeep learning 的这个ine
那另外外方面面
我如果说说看一阿阿尔a 的的个团队队
就像我刚才过程的
它里面的人
人才
包括你看到他的
呃
文章里面的一作
也都是非常非常杰出的各个背景的这样的一个科学家
不只是人工智能科学家
其实这就是我刚才讲到的
这是也是我们现在看创新非常重要的一点呢
就是跨学科合作啊
我们能看到说这个各个领域的顶尖的人物
人工智能的顶尖人物
生物学家
或构生物学家
然后各种各样背景的
然后数据工程师
所有的人聚集到一起
然后才可以把所有这些信息整合到一起去进行应用
其实最早我开始投人工智能在医疗领域应用的时候
我当时就发现
这个领域最大的问题
并不是说缺少应用场景或者缺少人才
其实都有
但的问题就是两边实际上在之前没有很好的沟通
对对方有误解
其实很多传统的生物学家很看不上有人人工智能做很多生物学相关的这些分析
觉得他不够准确
一些刚开始的一些人工智能的团队呢
经常会提出一个所谓的vision
就是我们要替代掉这些人
包括最早的一些时候
替代掉医生啊
替代掉护士啊
替代表结构生物学家
所以两边就是形成了这样的一个对峙的状态
但实际上
如果双边开始合作
就像阿尔法的这样
把这些人集合到一起
其实确实是互相赋能
就像我讲的
我们一直在聊阿尔法的对整体结构生物学的影响
但是就像我提到的
也是因为结构生物学它本身的发展可以去持续的在过去支持的阿尔法fofofour 的发展
给它提供了非常充足的高质量的数据
在未来也会持续的去支持它的发展
就跟我们在互联网这些大数据的这些领域是一样的
对我们有如有了很多的data 之后
我们才能够来这个训练这个ai
能够让大家才能用上这样的一个数据
去做更多的这个发掘
对
我觉得应该就是相辅相成
这个历史的这个进步的必然
对 对
而且其实我们现在还有很多问题需要去解决
就比如说像阿尔法fold
它提出了说他可以成功预测出来结构
但是我们现在其实对于很多人工智能的算法
还有一个大的问题
就是他们们预测出来的这个方面
这个规律
实际上它是一个黑盒子嘛
就是你要要可解释性
所以这些东西其实并不是说单纯靠人工智能技术可以去解决的
这个可能反向反而需要结构生物学家去从他们的角度再去验证
说到底这边预测出来的验证了什么样的功能
然后去把这个结构和功能性做一个更好的
呃
Correlation
就是更好的一个连接和对应
嗯嗯 唉
我不知道
你有这个仔细读他们的这个比赛
我还不是特别清楚他们整个的一个比赛的一个流程是怎么样
就是组织方给你出了一个题目
然后大家去用不同的自己的算法去预测
然后后面再分析谁的更接近这个命题
是这样的一个过程吗
对
大概是这样的一个过程
实际上他们就是会选择一些在过去几年也已经被就是通过我们讲说冷冻电镜最新结构出来的一些蛋白质来作为他们的一个考题
他们的三d 结构
然后呢
就会有各种各样的团队来提交
当然不是说都是一定要用人工智能的方法
有各种各样的方法来去
呃
提交他们的这个对这个蛋白质三d 结构的预测
基于他们这个氨基酸碱基啊
碱基队它之间的这个排序
包括其实你看今年参与的其实还有一些诺贝尔奖的获得者呀
然后除了像
呃
谷歌参与的
像微软啊
这些大的公司
好像中国也有企业参加啊
还有一些很多学校去参加
所以其实他参与的啊
机构和背景都是非常强的一个团队
那阿尔法的今年当然是非常出色
他的领先程度还有准确率是最高的
而且领先第二名很多
好的
那我觉得其实今年也是还没有非常神奇的一年
然后我们其实在生物领域
你投资或者是看到的一些串是有什么东西呢
嗯
其实我觉得
其实我们今天聊阿尔法for 的就是一个非常好的切入点
那阿尔法for 的就是一个非常好的代表
是怎么样用文长的新技术就人工智能在医疗领域的应用
在生物学领域的一个应用
因为整体上这就是一个非常大的趋势
因为从我们人体上来讲
我们其实有很多
无论是对我们自己本身的大脑
对身体结构
包括基础的细胞蛋白怎么运作
还缺少很多的认知和解释
它到底是怎么样去运作的
那这个缺失也是因为我们之前实际上没有能力去收集这么多的人体的生理性的数据
同时通过这些数据去挖掘这些价值
所以我觉得现在一个非常好的一个时界点
就是我们周围布满了这些低成本的传感器
或者说是一些设备
包括我们的手机
而且这些传感器的价格都在不限的降低
我们可以多维的去收集各种各样的这些数据
然后呢
再通人工工智能这样的工具去进行数据的优化
筛选 选择 分析
然后去进一步的去反向辅助我们在医疗层面上
无论是诊断还是说是个性化治疗
其实我们包括经常讲说癌症的一个最终的初估路
它就是一个个性化的诊疗
那怎么样能完成个性化
那你必须要借助数据的力量
还有人工智能的帮助才能够去完成
所以它是一个整体结合的过程
就是经常讲说
不是用人工智能去替代
而是说用人工智能去叠加在我们现有的这些医疗手段
医疗器械之上
所以这绝对是一个非常大的趋势
也是我们一直在投的趋势
我是从一七年开始投
然后呢
今年就非常明显感受到
我投的所有这些人工智能在医疗领域的公司
今年一年的无论是说它的收入增长
融资增长
甚至说退出各方面都非常非常的惊人
是因为今年可能大家也是由于疫情的影响
看到的这方面的一个迫切的一个需求
如果说再去具体细分去看的话呢
因为刚才这好也提到了一个
就是跟结构生物学相关的
我刚才提到说由于蛋白质折叠引起的一个疾病
就是脑部疾病
就帕金森老年痴呆
实际上这也是我非常关注和非常希望看到更多技术应用的一个领域
就是精神类疾病的在新技术方面的一个整合
就是比如说我们经常讲到的帕金森老年痴呆
尤其是老年痴呆
还有其他的像比如说抑郁症这些
呃
其实我们以前没有很好的技术手段去对待这这类疾病进行持续性诊断
因为大家可能经常想的
所谓的诊断
你是一次性诊断对吧
你去看医生
这次测一些东西
然后告诉你是不是有得这个疾病
但是脑部疾病
比如说像老年痴呆
你很难说
我看你一下
知道你有没有得老年痴呆
它需要一个持续的一个监控
然后信息的分析收集
才可以进行很早期的诊断
但现在我们就是有了这样的技术条件
那除了人工智能之外
我另外一个今年年初也在旧金山的这个jp morgan health care conference
就医疗大会上
我一七年是发的人工智能的报告
今年我其实在演讲的时候
讲的就是边缘计算
那现在其实医疗领域还有一个大的挑战
就是数据量非常非常巨大
但是怎么样可以快速的进行啊数据的传输分析
实时反馈
其实边缘计算是非常关键的一个技术
那现在这些技术都已经开始整合的话呢
就可以帮助我们更好的找到各种疾病的相关性
比如说对于老年痴呆
对于特定的每个人
到底他的发病成因是什么原因
只有理解了他的发病成因
我们才可以更好的去
呃
去进行个性化的一个治疗
但这个脑部疾病
可能在以前
我们其实在这方面的发展是比我们对于心脑血管疾病和癌症关注的要少很多的
但
但是现在我们全球都在面临一个老龄化社会
所以脑部疾病就是比如说就像老年痴呆这个疾病
认知障碍这个病疾病本身就会成为一个全球非常大的一个问题
而且它本身给社会福利包括保险带来的负担也是非常巨大的
那在这个进境退步
哈
就是我也非常关注的一个领域
尤其是人工智能在医疗的应用
实际上是depression
就是抑郁
其实人的这些情绪抑郁这方面的
就是我们叫disorder
就是我也不知道中文怎么翻译过来
它其实是也是一个黑盒子
而且他每个人的成病的原因也都是比较有它的个性化的
所以这些都是我们新技术可以去啊
发挥非常重要影响力的一些方向
嗯嗯
如果我再追问一下
就比如说是现在前沿的
像我们在了解抑郁
然后在了解
呃 老年痴呆
大家现在前沿的用的研究的方法
或者大家的技术手段现在是什么样的呢
嗯
你是说就是新的技术还是传统的技术
就是现新的技术
就是你投资的
或者是你看到大家现在正在研究的方向是什么样的呢
呃 新的技术
当然
其实比最基本的
就我我到的
其实就阿阿尔法fod 一样
它其实是把人工智能引入进来
然后依托于现有的已经存在的收集的大量的这些生理性数据
去进行相关性的联系
去进行个性化诊断
比如说发现说哦
这个人得老年痴呆
他很可能的原因是因为他经常抽烟
那个人很可能是比如说基因的问题
然后呢
再和他其他的一些检测手段的结果去进行相结合
所以它是一个辅助的一个方式
同时的话
我觉得就是因为我们可以通过人工智能
还有包括这些低成本传感器进进你大量数据的收集
我们可以进进行更好的建模
所以可以进行更好的早期诊断
也或者说早期诊断
它有一定预防的一个功能嘛
然后从可能大的社会的层面上的话呢
你可能也可以对整体的这个比如说加州的这些人群做一个预判和预诊断啊
然后有一个比如说从社会层面上
政府层面上
Regulation 的层面上
监控监管层面上的一个预判
所然这是比较多的
现在看到人工智能的一个应用
当然还有更加先进的技术
就比如说像纳米机器人
因为今年还有一个就是伊朗mask
他不是发布了它那个脑机接口的公司嘛
但其实它并不是这个领域做的第一家公司
像科ll 前一年也是做的很不错
我们投的一家公司叫parwer domics
这是这领域的第一家公司
它一五年就开始做了
也是拿了国防部就大量的就是这种免费的funding 的资本在做应用
那这可能就是更多的早期诊断
它其实是用这种纳米纤维驱动的纳米机器人
然后植入到大脑之后
用纳米纤维重建脑神经递质的传递
通过重建脑神经质地的传递
实际上不就可以修复部分脑损伤吗
就比如说像帕金森
其实它就是有一部分脑
大脑的一部分
它变灰色了
它脑神经递质的传递停止了
以前的很多你就其实已经失败的药
它的目的是想去刺激那部分重新进行信息传递
但是做不到
但是我刚才讲的这样的纳米机器人的技术
它其实比较简单直接就是像你心脏搭桥一样
你这边不通过
我给你再搭一个
同时它在修复脑损伤的同时
重建脑回路的同时
它其实也形成了一个接口嘛
我们以前其实很大的一个问题是怎么样去理解我们的大脑的神经网络运作的
信息怎么传输的
是很难去有一个孔
就是全面的一个信息收集的
一方面是说
你知道我们大脑中的这些它神经元在去运作的时候
它实际上是一个就像布脑运动一样
它是说说单线程的
或双双程的
他是很random
他是来回来去走的
但是呢
我们计算机去处理数据的时候
它是单线程的
所以有了像这种纳米机器人的这样的一个端口之后的话呢
我们可以把这些信息收集了之后呢
通过我们中间一个处理器
Cmos 处理器
把它处理成单线程的数据
去让机器去进行读取
这样的话
其实也是一个数据处理的过程
也就是大家经常理解的说所谓的脑机接口
你包括今年医疗mass
他不是宣布他们那个当时在judian 上
他们带宽能处理多少信息嘛
我们投的那家公司por jourmes 在三年前实际上处理信息能力已经是他们的大概四倍左右了
所以这些的发展都会让我们更好的去分析收集
然后去理解大脑脑怎怎样运运作
我们们只有更好的确确理解解了这个脑脑怎怎么运作
我们才可以对症下药的去理解解底底哪步步错了
才会导致某种疾病
然后去试图的去修复它
我觉得现在可能大家很多人的关注点还在癌症上
是因为癌症症听来来可怕
怕来了之后来来来势汹汹
但是真的我们要从宏观的角度讲的话呢
去看整体的人口基数
还有说未来老龄化社会的这个趋势
脑部疾病
神经类比疾病
尤其像老年痴呆这类的几名会是我们非常非常巨大的一个挑战
是的 是的
我其实我们
我家
然后还有我身边的一些朋友
我觉得这个比例现在是越来越长了
因为大家其实现在的这个寿命是越来越长的
我们现在不关心这个话题的话
那可能后面对的我们没有办法应对整个逐渐变老龄化的这个整个全球的社会
其实我看你这个今年大概投了大概能有九十九个项目
十个项目
所以大概这个方向你是在往哪个方面看的
我们刚刚聊了像是这种可能depression
还有精神类疾病这些方面的一些创业公司
然后你今年还出手了一些什么样的项目呢
嗯
今年我一共是其实到目前投了七个项目吧
我觉得除了医疗之外的话
其他一个重要的方向
我投比较多的
其实还是相关于数字化转型
就我们一直在投这工业和企业的数字化转型
当然今年由于疫情的加速
大家都必须要做数字化转型
所以也推进了很多传统统业在这个方面的技术的应用整合
当然是一个重要的转型
但是我觉得除了就是直接处理数据之外
我们可能也布局了一些非常好的和网络相关的
还有就比如说这网络技术相关
像边缘计算这方面的
也在持续布局
另外一个的话呢
包括其实今天我们聊之前
我刚才在跟团队开一个会
我们在做我们新一轮的行业报告
其实针对的还是说数据安全的问题
因为现在其实另外一个比较火热的话题
大家经常在讲的就是科技的一个监管嘛
对于大型科技企业的一个监管
但其实在我看来
这个监管最核心的部分
实际上是对数据的监管
嗯
我们经常讲科技企业的所谓的垄断
我觉得它的核心是数据垄断
所以这个数据垄断
它需要技术去解决
它也需要监管去解决
它无法通过单一的一个方式去解决这个问题
我觉得这是一个趋势
而且它是一个必然会到来的趋势
无论将来我们是监管的角度
还是技术的角度
我们必须解决它
而且它也不只是一个科技领域的一个问题
因为我们自己建了一个cxo 网络
已经好几年了
在这个网络里
我们大概有大概三十二个都是美国这种就是一千强企业里面的c level
就是他们的首席技术官或首席数据官
就比如说像target
你知道target 美国这种连锁的传统的超市
包括一些美国传统的这些大型的企业
他们都开始设一个新的职位
叫首席数据观
因为它意识到数据的重要性
我觉得现在大家都必须要有一个基本概念
就是数据是资产
数据可能是我们未来最有价值
最快增长的资产
那对于企业和公司也是一样
那他们也想去更好的去抓住数据的价值
抓住资产的价值
但同时也要保护他们自己
所以像我其实今年跟他们很多的这种讨论
他们经常在问我的就是跟数据监管相关的
因为一方面他们有海量的数据
他们从来没有用过
但是他们现在开始数据了
又担心未来如果监管的话呢
他们怎么样可以通过技术解决方案去规避自己的潜在的风险
还有连带责任
所以我觉得针对这些数据的
无论是说他的处理
脱敏
怎么样去定义数据的所有权
去进行更好的数据追踪
这也是非常非常关键的一个方向
而在这些方向里面
拥有最大量最高质量数据的领域就是医疗
其次就是保险
所以这也是为什么他又回到了说实际上也是跟医疗领域紧密相关的一个方向
其实很多
包括我们就是之前讲说
为什么阿尔法zero
阿尔法go 引起那么大的轰动
或者说大家的关注
但其实阿尔法fold 是有更强的商业价值
反倒可能大家的关注点没有那么多
也是因为可能阿尔法zio
阿尔法go 它以围棋这样一个大家好像都马上能够理解和切入的点
去展现了它的一个应用
但是阿尔法fold 呢
确实 呃
可能如果没有一定的背景知识
大家看不到这个技术的革命性
它的关键性
和它未来会对我们整个各个产业还有生活的一个影响响
但实上上
我觉得这个一一解解释
其实能让大家看到
为什么这个技术非非非常关键的
而且这个进展对于整个就是只是我们单纯讲说学术层面的结构生物学
而是所以我们整个各个商业层面的应用
都是一个非常大的一个进步和推动
包括其实我们本身
其实看到这个消息是非常非常激动和高兴的
因为很多的以前我们看到说
包括我一直为什么不太碰
就是说生物制药这个领域就是因为它在早期的研发的需要投入的时间
还有包括它需要投入的资产的量
其是太巨大了
所以对于一个基金来讲的话
我需要考虑说它的投入
还有说产出
包括说将来的一个退出的一个时间
但是如果像阿尔法four 的这样的技术开始做商用化
实际上这个研发的周期会大大减短
其实对于我们这样的vc 来讲的话
我们可能也就会更愿意在这个方向去进行更多的一个资本投入
以前现在实际上更多还是说大资本
甚至说药厂在这个方面的投入
但未来很可能也会打开
呃
资本的多样性
参与者的多样性
所以就更能激发更多一些新的创新的技术通过这样的一个驱动区涌现出来
所以我觉得真的是非常值得就是大家关注的一个技术
只是说可能现在没有看到大家像关注阿尔法购那样关注阿尔法four 的
对对对
就是有的时候
大家没有在自己脑海里面就是形成一个对标的东西
因为大家都知道围棋
对
你说我们大家作为一个包on dynamic
然后有一个特别这个好的视频给大家看到话
这个牛逼
但是你如果再讲到这个alpha four 的
就你像翻两下
你稍微再解释一下什么叫做蛋白质折叠
你再解释一下什么是这个冷冻电竞
然后大家就已经已经完全lost 掉了
对 嗯
所以我觉得给大家有一个这样的对标
是我觉得能给让大家能重视起来这个东西吧
我们都在这个风投圈或者是科技圈嘛
其实看多少人转发了
其实是聊寥无几的的
就完全不像是当时可能alpha go 大家完全就刷了屏了
对 是的 是的
那好的
我们今天谢谢张璐来做客我们的节目
帮我们这个深入浅出的聊一聊这个alpha four 然后是什么
然后同时我们未来可能会有什么可期的在商业上面的应用
非常感谢张璐帮我们做了这么精彩的解释
好的 谢谢
谢谢丁奖
谢谢
今天的节目就到这里
这期节目除了主播和嘉宾
也感谢我们团队的迪卡
布里辛
陈太太和look
他们在最短的时间内完成了节目后期的制作
也感谢小爱
他是每次将音频上传到各个平台的人
他同时也是申小英这个账号背后的小伙伴
同时也感谢紫珊和amanda
他们每次都将音频整理成文字
并发布到我们的微信公众账号上
如果大家想要长期关注我们
也可以订阅我们的微信公众号
搜索生动活泼这四个字就可以找到我们
声是声音的声
也请支持我们
例如在您所收听的音频平台上点赞打分
或者通过打赏的方式支持我们
打赏方式在我们的微信公众号以及网站声刀fm 上都能找到
Sheng 到fm
当然也可以转发给你一两位朋友们
让他们也听到这档节目
也请大家继续关注我们之后的报道
那我们下期节目再见
推荐音乐
-
张艺兴 2.93 MB 03:11
-
Apink 2.97 MB 03:14
-
DinDin 3.13 MB 03:24
-
六小乐 3.12 MB 03:24
-
ProdbyMend 2.9 MB 03:10
-
微醺卡带 3.59 MB 03:54
-
吴建豪 2.72 MB 02:58
-
梦境里的算法official 4.12 MB 04:30
-
KiiiKiii 2.74 MB 02:59
-
程嘻嘻 3.2 MB 03:29
-
宁小泽 3.84 MB 04:11
-
伯远 3.87 MB 04:13
-
夏火ww 3.28 MB 03:34
-
纯爱高冷女神 3.94 MB 04:18
-
洛诗诗 3.07 MB 03:20
-
梦境里的算法official 3.13 MB 03:24
-
大头针 Official 2.86 MB 03:07
-
顾焕gkuank 3.17 MB 03:27
-
姜丹尼尔KANGDANIEL 3.52 MB 03:50
-
ProdbyMend 4.25 MB 04:38






























