近日,廣東東陽(yáng)光藥業(yè)股份有限公司(以下簡(jiǎn)稱(chēng):東陽(yáng)光藥)宣布接入Deepseek,啟動(dòng)AI+全面戰略布局。
東陽(yáng)光藥將從算力基礎設施建設、AI賦能藥物研發(fā)管線(xiàn)、AIDD智算模型構建、再到AI產(chǎn)研生態(tài)圈的全方位、多維度探索中逐步形成「AI賦能產(chǎn)業(yè)落地實(shí)踐」的優(yōu)勢路徑。這一路徑不僅促進(jìn)了創(chuàng )新研發(fā)的提質(zhì)增效,也逐漸在多場(chǎng)景中成功落地。
科研過(guò)程海量的文獻和專(zhuān)利閱讀是巨大挑戰。在科研數據收集獲取時(shí),數據分散、格式雜亂,形成數據孤島;且知識更新速度快,獲取信息困難;靶點(diǎn)調研依賴(lài)於人工檢索、閱讀、篩選以及信息的提取與匯總,工作量巨大且效率較低。
此次東陽(yáng)光藥與深勢科技的合作,將構建新一代AI文獻與專(zhuān)利數據庫檢索、問(wèn)答、分析管理大模型平臺——HEC-Finder。該平臺聚焦藥物研發(fā),為科研人員提供科學(xué)文獻的智能檢索、分析及關(guān)鍵信息提取等功能,助力研發(fā)效率提升。
圖1 HEC-Finder文獻閱讀問(wèn)答示例
據介紹,該款多模態(tài)文獻研讀工具,底層訓練了大量藥物研發(fā)相關(guān)科學(xué)文獻,通過(guò)整合文本、圖表和圖像等多種數據格式,提供全面的內容解析與提取。在藥物開(kāi)發(fā)領(lǐng)域幫助科研人員識別研究趨勢,從海量的文獻中提取有針對性的信息。
該平臺可以實(shí)現專(zhuān)利數據的自動(dòng)化更新、精準檢索和深度分析;快速提取化合物結構和活性信息,提高研發(fā)效率;自動(dòng)化快速判定結構專(zhuān)利侵權情況,降低法律風(fēng)險。
圖2 HEC-Finder文檔信息抽取示例
通過(guò)私有化部署,保障核心數據資產(chǎn)安全,通過(guò)領(lǐng)域微調,提升模型在特定領(lǐng)域的準確性和適應性。目前該平臺已上線(xiàn)並投入使用。
東陽(yáng)光藥已將DeepSeek大模型全面接入 HEC-Finder平臺,充分釋放AI在文獻專(zhuān)利智能應用的潛能。
未來(lái),Deepseek大模型將更深入得應用於東陽(yáng)光藥AI4S各個(gè)科學(xué)研發(fā)領(lǐng)域,從而進(jìn)一步加速管線(xiàn)項目研發(fā)效率提升並提高研發(fā)成功率。
來(lái)源:創(chuàng )新松山湖