预料——因为根据官方给出的数据来看 在物理上的分数达到了 .已经远超其他两门学科这或许就是崔博士对它比较看好的原因。 综合来讲真要说到超越专业博士水平位博士们认为还得缓缓。 崔博士直言在现实科研工作中多数情况学者们都还得自己动手 只能提供致方向因此花钱要这样的细致 意义不。 他表示他更推荐本科生选择这个 要是硕博阶段那这个 的回答其实并不符合导师标准组会上肯定要挨批。 清华的信博士也同样持这种看法且不说 的幻觉编造文献问题就专业程度而言 的回答也只能糊弄同行也就是同学科里面方向不同的群;而在小同行专业研究这个方向的眼里 的毛病还是非常明显的。 北 博士则谈的更深入他认为这个 只能说在认知上有了硕士生的水平但也只是作为个缝补匠谈不上说出什么创造性的成果。就创造性这点来说 是远远比不上硕博的水平的这也是 需要解决的重要问题。 在博士们的评价里我们似乎能抓到个重点 模型之所以相对更强是因为他有了更高维的认知和思考模式。 这也是 本次更新的要点。在 于 模型原理解释的文章中他们表示 变强主要是他们用上了长思维链 ( 而不是传统的提示链 。 第眼看上去有点懵说话就是这个模型改变了以往那种你问我答的思考方式。 在以前的模式下模型的问答就跟下意识出答案样比如你问我天是啥颜色这问题我想都不想秒答蓝色。这实际上需要我本来就知道这个知识点然后给你直接反应就完了。 但这个长思维链就相当于我不仅要知道蓝色是个啥还能自己推遍为啥是蓝色什么气散射光谱波长都要考虑进去。 这就需要 得有实打实的构建逻辑推理论证的能力换句话说他不仅要长脑子还要动脑子。 尽管思维链这个概念是 年谷歌提出来的但 这次是第个实现的。 实操过程中现在你与 模型对话除了收获答案还可以看选择展开看他解答问题时的思维逻辑他的思考是具象化的而不是黑盒。 我们拿崔博士提问的 远距离纠缠光子分发有什么克服白噪声的办法? 这问题为例 模型的思考过程如下 当我们询问崔博士这个思考过程是否合理时崔博士表示合理达到了博士级别还是高年级博士级别。所以 模型之所以会在物理学问答上面表现更出色就是因为他的思维链达到了博士的水准他会像博士样思考物理问题。 同理 模型在生物学化学方面年表现相对不佳很有可能是是思维链还没训练到最佳状态但是从物理学问题的表现来看等到训