Lockridge Okoth

Lockridge Okoth 是 BeInCrypto 的记者兼技术分析师，报道涵盖数字资产、DeFi、NFT、GameFi、RWA 以及更广泛的区块链技术领域的重大动态。他还关注股票和黄金、白银等商品避险资产。他报道的内容包括影响市场的事件，从美联储政策变化到重大法律及机构事件，向投资者和行业领袖提供及时、以研究为基础的分析。凭借对新闻敏感的嗅觉和对公关炒作的免疫，他为读者带来关于流动性趋势、机构采用和新兴链上创新的犀利见解。他曾与美国、欧洲、非洲及亚洲的领先金融机构和生态建设者合作，并在 ETHSafari 2025 的 “On the Ground with Lisk” 圆桌会担任主持人，推动开发者、监管者、媒体与生态建设者之间的讨论。工作之余，他为亲友管理着一个小型基金，将技术分析、基本面分析与新闻调研相结合。 Lockridge 毕业于肯雅塔大学，获分子生物学学士学位；获 USIU-Africa 传媒与传播学硕士学位，并持有伯克利的区块链基础课程认证。如有相关报道线索，欢迎通过以下方式与他联系：[email protected]。

2508 发布文章

币安遭英国投资者起诉索赔2亿美元杠杆损失

特朗普披露 2025 年加密货币超十亿美元收益

Anthropic 与 OpenAI 拓展 AI 科研领域

更喜欢用Telegram？

分享

Anthropic 与 OpenAI 拓展 AI 科研领域

在 Google 上选择我们

作者

Lockridge Okoth

编辑

Mohammad Shahid

30日六月 2026年, 11:43 PST

Anthropic 推出 Claude Science 科研 AI 工作台
OpenAI 推出 GeneBench-Pro 计算生物学 AI 基准
OpenAI 最新模型生物测试通过率仅 28.7%

#人工智能新闻

Anthropic 与 OpenAI 于周二掀起新一轮 AI 竞赛，两家公司均将目标瞄准科学研究领域。Anthropic 推出人工智能实验工作台 Claude Science，助力科研人员提效；OpenAI 则发布了面向计算生物学的基准测试 GeneBench-Pro。

当天同步发布，标志着这场 AI 竞赛已经从聊天机器人、编程工具进一步延伸至实验室科研应用领域。一家公司用实际工具赋能科研工作，另一家公司则用全新评测标准设定了领域技术进步的标尺。

Anthropic 的 Claude Science 功能详解

Claude Science 将科学家常用的数据库、代码与算力整合至同一个应用之中。其支持接入超 60 个跨基因组学、蛋白质组学和化学信息学的科学数据库。

Introducing Claude Science, a new app designed with every stage of research in mind.

Artifacts traced to their code, environments managed on demand, and 60+ optional scientific databases that you can connect.

Available now in beta. pic.twitter.com/HKhLknxLJO
— Claude (@claudeai) June 30, 2026

需要注意的是，Claude Science 是一款应用，并非全新模型。其发布时，Anthropic 当前最强大的 Fable 5 与 Mythos 5 模型仍受制于美国出口限制，无法开放。所有操作结果均可追溯原始生成代码，实现可审计性。

这款实验平台是 Anthropic 自 2025 年 10 月启动生命科学战略以来的又一重要举措。在内测阶段，Allen Institute 的 Jérôme Lecoq 借助该工具将原本需耗时 2 年的审稿研究大幅压缩至极短周期。

此外，Anthropic 还将对至多 50 个科研项目提供资金支持，每个项目最高可获得 3 万美元的算力奖励。

OpenAI：“GeneBench-Pro”树立全新标杆

紧随 Claude Science 上线，OpenAI 推出全新基准测试 GeneBench-Pro，聚焦评判 AI 智能体能否胜任真实生物学研究中的复杂决策与推理任务。

We’re introducing GeneBench-Pro, a research-level benchmark for a harder kind of AI progress: how well agents can navigate messy biological data, choose the right analysis path, and make judgment calls that real computational research depends on.https://t.co/AsilnnSxnE
— OpenAI (@OpenAI) June 30, 2026

GeneBench-Pro 涵盖 129 个来自基因组学、定量生物学及转化医学等领域的实际科研难题。

OpenAI 最强模型GPT-5.6 Sol 在最高推理水准下能解答 28.7% 的问题，Pro 模式下该比例提升至 31.5%。此款强大模型的分阶段发布系应华盛顿政府要求。

在最初版 GeneBench 测试中，GPT-5 得分低于 5%，而 Anthropic 的 Opus 4.8 在难度更高的新测试中取得了 16% 的成绩。

关注我们的 X（原推特），及时获取最新实时快讯

两大路线博弈，目标殊途同归

Anthropic 与 OpenAI 的差异化策略凸显，皆指向提升科学研究效率的共同目标。Anthropic 推出面向实际实验室场景的工具产品，OpenAI 则致力于评测大模型在复杂、杂乱科研数据下的可靠推理能力。

与此同时，中国人工智能模型正在科研领域取得突破。尽管外界炒作不断，但据 OpenAI 数据显示，其最先进模型在 GeneBench-Pro 大部分任务中依然表现不佳。

当前压力既有地缘政治因素，也有科技竞争。美国出口管制已促使 Anthropic 考虑将其模型托管在欧洲等新地区。

专业人士估算，完成每一道 GeneBench-Pro 题目，人工专家需 20 到 40 小时，成本数千美元。OpenAI 称，其模型只需数美元即可完成同样分析。

生物老年学家 Aubrey de Grey 表示，即便人工智能在整体领域的突破尚需时日，但其已能打破科研中的关键瓶颈。

“我们即将看到，人工智能将很快让部分环节——尤其是药物研发，不再是限制速度的最大障碍。”Longevity Escape Velocity Foundation 主席兼首席科学官 Aubrey de Grey 在 BeInCrypto 播客中表示。

不过，de Grey 也提醒，想要将研究提速转化为真正获批的疗法，仍需仰赖监管环境，以及社会公众对风险的容忍度。

研究人员预计 AI 将加速应用落地

部分专家认为，这一转变已在悄然发生。免疫学教授 Derya Unutmaz 在同一 BeInCrypto 讨论会中表示，AI 已在专业判断上超过了自己。

“在我从业 35 年的领域，我个人比起自己的判断更信任人工智能。”

他预计，这种依赖将在临床环节迅速普及开来。

“不使用人工智能从事医疗实践，已经是不负责任，未来也很快会被视为医疗失当。”

不过，研究领域的乐观预期仍然快于当前基准测试成绩。未来数月将见证，科学家是否会广泛采纳这些新工具，GeneBench-Pro 得分能否持续提升。

要阅读来自BeInCrypto的最新加密货币市场分析，点击此处。

更多关于AI 公司的内容？

在 YouTube 上观看

Stani Kulechov: How Aave Processed $500M in Liquidations Without Breaking

Stani Kulechov: How Aave Processed $500M in Liquidations Without Breaking

Can Robinhood Finally Deliver ‘Private Equity for All’?

Can Robinhood Finally Deliver ‘Private Equity for All’?

Adam Back: Satoshi’s Email & The Future of Bitcoin

Adam Back: Satoshi’s Email & The Future of Bitcoin

推荐内容

LongCat-2.0 成为最大无英伟达芯AI模型

AI 行业相关板块就业由增长转为下滑

Anthropic 与加州政府达成合作 Claude 提供五折优惠

WhatsApp 推出用户名功能支持号码隐藏

文章免责声明

本篇文章僅供參考，不應視為金融或投資的具體建議。BeInCrypto 致力於提供準確、公正的報告，但市場情況可能會有所變化，恕不另行通知。在做出任何財務決定之前，請務必自行研究並諮詢專業人士。請注意，我們的《服務條款與細則》、《隱私政策》以及《免責聲明》已更新。

接下来阅读

LongCat-2.0 成为最大无英伟达芯AI模型

LongCat-2.0 成为最大无英伟达芯AI模型