經(jīng)過(guò)長(zhǎng)時(shí)間的發(fā)展,大量的材料學(xué)術(shù)文獻(xiàn)積累了豐富的科學(xué)成果,以文本形式散布在文獻(xiàn)中的科學(xué)知識(shí)一般仍由研究人員手動(dòng)收集和分析,這通常十分耗時(shí)且難以保證信息的完整度。如果將文獻(xiàn)中的材料科學(xué)信息表示為結(jié)構(gòu)化的知識(shí),再結(jié)合知識(shí)關(guān)聯(lián)、融合、推理等方法,構(gòu)建材料知識(shí)圖譜,可以使研究人員準(zhǔn)確而又高效地獲取信息,并對(duì)過(guò)往研究進(jìn)行脈絡(luò)梳理,對(duì)有潛力的材料進(jìn)行剖析。北京大學(xué)深圳研究生院新材料學(xué)院潘鋒教授課題組近年來(lái)致力于構(gòu)建材料知識(shí)圖譜以及解決其關(guān)鍵科學(xué)問(wèn)題和技術(shù)難題,發(fā)展了一套高精度且高效的同名消歧以及信息搜索框架,在材料科學(xué)領(lǐng)域建立了主體(作者)與客體(材料)之間的對(duì)應(yīng)關(guān)系,結(jié)合機(jī)器學(xué)習(xí)和依賴(lài)匹配算法,構(gòu)建了名為MatKG的材料知識(shí)圖譜,并對(duì)鋰離子電池正極材料LiFePO4進(jìn)行自動(dòng)化分析,生成其發(fā)展里程碑,追蹤其研究趨勢(shì),相關(guān)成果已發(fā)表于《先進(jìn)能源材料》(Advanced Energy Materials, DOI:10.1002/aenm.202003580)。
在此基礎(chǔ)上,潘鋒課題組進(jìn)一步深入研究材料知識(shí)圖譜的構(gòu)建技術(shù)和應(yīng)用潛力,實(shí)現(xiàn)了對(duì)隱藏在文本中的潛在材料關(guān)聯(lián)的挖掘,進(jìn)一步實(shí)現(xiàn)了材料的推理預(yù)測(cè)。近日,他們?cè)凇断冗M(jìn)功能材料》(Advanced Functional Materials, DOI:10.1002/adfm.202201437)發(fā)表題為“Automating Materials Exploration with a Semantic Knowledge Graph for Li-ion Battery Cathodes”的研究論文。該研究提出了一種可實(shí)現(xiàn)材料科學(xué)知識(shí)嵌入的語(yǔ)義表示框架,通過(guò)多源信息融合提高材料實(shí)體的表示質(zhì)量以對(duì)材料科學(xué)文獻(xiàn)中的鋰離子電池正極材料實(shí)體進(jìn)行精準(zhǔn)挖掘并構(gòu)建正極材料知識(shí)圖譜,預(yù)測(cè)高性能鋰電池材料。該工作在幾乎不需要領(lǐng)域知識(shí)的情況下,實(shí)現(xiàn)了復(fù)雜材料系統(tǒng)的基于文本挖掘的高效知識(shí)融合和推理與預(yù)測(cè),將助力實(shí)現(xiàn)數(shù)據(jù)驅(qū)動(dòng)的材料研究新范式。
材料科學(xué)文本中包含大量非結(jié)構(gòu)化、高度異構(gòu)形式的材料科學(xué)信息,并且材料子領(lǐng)域擁有特定的領(lǐng)域知識(shí),不同子領(lǐng)域之間差異明顯,這都對(duì)材料科學(xué)知識(shí)的精準(zhǔn)挖掘造成了極大的挑戰(zhàn)。由于數(shù)據(jù)驅(qū)動(dòng)的材料研發(fā)新范式的應(yīng)用價(jià)值,構(gòu)建整合材料特性和應(yīng)用信息的數(shù)據(jù)管理平臺(tái)成為了目前迫切的需求,而基于文本挖掘的材料知識(shí)圖譜構(gòu)建及材料推理預(yù)測(cè)正是解決這一需求的重要手段。
課題組發(fā)展了一套名為DATWEM的材料信息語(yǔ)義表示框架,以針對(duì)性生成特定子領(lǐng)域的材料實(shí)體表示,解決了復(fù)雜材料系統(tǒng)中的材料實(shí)體挖掘問(wèn)題。該框架結(jié)合BiLSTM和雙重注意力機(jī)制,通過(guò)多源信息融合提高詞嵌入的質(zhì)量,以對(duì)材料科學(xué)文獻(xiàn)中的特定領(lǐng)域材料實(shí)體進(jìn)行精準(zhǔn)挖掘。他們將該框架應(yīng)用于鋰離子電池正極材料領(lǐng)域知識(shí)圖譜的構(gòu)建:首先對(duì)材料科學(xué)文本信息進(jìn)行向量化;接下來(lái)使用兩個(gè)獨(dú)立的詞嵌入模塊對(duì)兩種不同語(yǔ)料庫(kù)(無(wú)機(jī)材料語(yǔ)料庫(kù)和正極材料語(yǔ)料庫(kù))分別進(jìn)行編碼,兩種語(yǔ)料庫(kù)編碼后的詞嵌入和關(guān)鍵詞模塊的詞嵌入隨后會(huì)被輸入DATWEM框架經(jīng)過(guò)雙層注意力模塊實(shí)現(xiàn)多源信息融合,增強(qiáng)材料實(shí)體的表示質(zhì)量;最后量化材料實(shí)體之間的相似度以構(gòu)建鋰離子電池正極材料知識(shí)圖譜。
材料知識(shí)圖譜的構(gòu)建流程
課題組在該知識(shí)圖譜的基礎(chǔ)上進(jìn)行潛在正極材料的推理預(yù)測(cè),通過(guò)無(wú)監(jiān)督聚類(lèi)對(duì)不同材料之間的語(yǔ)義相似性進(jìn)行可視化,保留與四種代表性正極材料(LiCoO2、LiFePO4、LiMn2O4、Li2MnO3)相關(guān)的較大聚類(lèi)簇。在對(duì)已包含在語(yǔ)料庫(kù)中的正極材料進(jìn)行過(guò)濾后,他們發(fā)現(xiàn)了一種潛在的正極材料——Li2TiMn3O8,該材料與典型正極材料LiCoO2通過(guò)層狀結(jié)構(gòu)這一明顯共同特征形成直接連接路徑,通過(guò)包含適合用于正極材料的可變價(jià)元素這一潛在共同特征形成間接連接路徑,從而根據(jù)直接及間接路徑實(shí)現(xiàn)了該潛在材料的發(fā)現(xiàn)。
材料知識(shí)圖譜用于鋰電池正極材料的發(fā)現(xiàn)
北京大學(xué)深圳研究生院新材料學(xué)院碩士畢業(yè)生聶志偉為該論文的第一作者,潘鋒、新材料學(xué)院李舜寧副研究員以及深圳市內(nèi)容中心網(wǎng)絡(luò)與區(qū)塊鏈重點(diǎn)實(shí)驗(yàn)室雷凱研究員為共同通訊作者。該研究得到廣東省軟科學(xué)研究計(jì)劃項(xiàng)目、化學(xué)與精細(xì)化工廣東省實(shí)驗(yàn)室、深圳市科技計(jì)劃、國(guó)家自然科學(xué)基金以及廣東省重點(diǎn)領(lǐng)域研發(fā)計(jì)劃的支持。(來(lái)源:北京大學(xué))
中國(guó)汽車(chē)工業(yè)協(xié)會(huì)吁車(chē)企避免以低于成本價(jià)傾銷(xiāo)商品
比亞迪近期大幅下調(diào)多款智能駕駛車(chē)型售價(jià),引發(fā)市場(chǎng)對(duì)新一輪價(jià)格...(806 )人閱讀時(shí)間:2025-05-31第一期“人工智能與機(jī)器人產(chǎn)業(yè)創(chuàng)新發(fā)展專(zhuān)題研討會(huì)”成功召開(kāi),共
近日,第一期“人工智能與機(jī)器人產(chǎn)業(yè)創(chuàng)新發(fā)展專(zhuān)題研討會(huì)”在東方...(693 )人閱讀時(shí)間:2025-05-30DeepSeek發(fā)布新版R1 能力接近美國(guó)頂尖模型
人工智能起步公司深度求索(DeepSeek)發(fā)布其熱門(mén)推理模...(1002 )人閱讀時(shí)間:2025-05-30特斯拉股東集體喊話?cǎi)R斯克
據(jù)報(bào)道,5月28日,一群長(zhǎng)期投資特斯拉的養(yǎng)老基金股東聯(lián)名致信...(603 )人閱讀時(shí)間:2025-05-30嚴(yán)濟(jì)慈物理學(xué)英才班
未來(lái)技術(shù)講壇啟動(dòng) 韓杰才院士作首場(chǎng)報(bào)告
“天格計(jì)劃”兩顆衛(wèi)星載荷發(fā)射入軌并成功開(kāi)始空間科學(xué)觀測(cè)
“渝見(jiàn).會(huì)聚良緣——指間相遇 天作之合”職工婚戀活動(dòng)成功舉辦