2016-2022 All Rights Reserved.平安财经网.复制必究 联系QQ280 715 8082 备案号:闽ICP备19027007号-6
本站除标明“本站原创”外所有信息均转载自互联网 版权归原作者所有。
当然,计算机可以用来玩大师级国际象棋(国际象棋计算机),但他们可以做出科学发现吗?能源部劳伦斯伯克利实验室(伯克利实验室)的研究人员表明,没有材料科学培训的算法可以扫描数百万篇论文的文本并发现新的科学知识。
由伯克利实验室能源存储和分布式资源部门的科学家Anubhav Jain领导的团队收集了330万份已发表的材料科学论文摘要,并将其输入一个名为Word2vec的算法中。通过分析单词之间的关系,该算法能够提前几年预测新热电材料的发现,并建议尚未知的材料作为热电材料的候选材料。
“没有告诉任何有关材料科学的知识,它就学会了周期表和金属晶体结构等概念,”Jain说。“这暗示了该技术的潜力。但可能是我们发现的最有趣的事情,你可以使用这种算法来解决材料研究中的差距,这是人们应该研究但到目前为止还没有研究过的东西。”
该研究结果发表在7月3日的“自然”杂志上。该研究的主要作者,“无监督的词汇嵌入材料科学文献中捕获潜在知识”,现为伯克利实验室博士后研究员Vahe Tshitoyan,现在在谷歌工作。与Jain一起,伯克利实验室的科学家Kristin Persson和Gerbrand Ceder帮助领导了这项研究。
“该文件确定科学文献的文本挖掘可以发现隐藏的知识,纯文本提取可以建立基本的科学知识,”Ceder说,他还在加州大学伯克利分校的材料科学与工程系任命。
Tshitoyan表示,该项目的动机是难以理解大量已发表的研究。“在每个研究领域都有100年的研究文献,每周都有数十项研究出现,”他说。“研究人员只能访问其中的一小部分。我们认为,机器学习能否以无人监督的方式利用所有这些集体知识,而无需人类研究人员的指导?”
'王后+男人=?'
该团队从1922年至2018年间在1000多种期刊上发表的论文中收集了330万篇摘要.Word2vec在这些摘要中采用了大约500,000个不同的单词,并将每个单词转换为200维向量,或200个数字的数组。
2016-2022 All Rights Reserved.平安财经网.复制必究 联系QQ280 715 8082 备案号:闽ICP备19027007号-6
本站除标明“本站原创”外所有信息均转载自互联网 版权归原作者所有。