其次是增加数据的生产量,捕捉更多人类在实际工作中的行为。 更多捕捉人类在工作中的实际操作? 是的,捕捉更多人类的操作行为,同时投资于合成数据或混合数据。利用合成数据,同时让人类参与其中,从而生成更高质量的数据。我们需要像对待芯片生产一样看待数据生产。 就像我们讨论芯片生产的边界,确保有足够的生产能力来制造芯片。
对于数据也是一样的,我们需要有效
的数据生产边界,能够生成海量数据 WhatsApp 号码数据 来支持模型训练。 最后一个经常被忽视的方面是对模型的测量,确保我们能够科学地分析模型的不足之处,从而精确确定需要添加哪种数据来提高模型的性能。 大科技公司相对于独立实验室,在数据资源上有多大的优势呢? 大公司在利用现有数据资源时面临很多监管问题。你可以看到,在生成式 之前, 曾利用所有公开的照片及其标签来训练非常优秀的图像识别算法,但这在欧
洲遇到了许多监管问题,最终变得非常麻烦。 所以如何处理这些数据优势从监管角度来看,特别是在欧洲,还需要进一步观察。我认为大实验室的真正优势在于它们有非常盈利的业务,能够为 项目提供几乎无限的资金来源。对此,我非常关注,也很好奇它将如何发展。 行业中有一个问题是,是否大公司在 领域投入过多。如果你听他们的财报电话会议,他们会说,我们的风险在于投入不足,而不是投入过多。对此你怎么看? 是的,没错。你可以想象一
下,站在这些 的角度
比如 undr Pi 、Mrk Zukerberg,或者 ty Nde 的位置上。正如你所说,如果他们真正抓住了 的机会,他们可能很容易地为公司增加一万亿美元的市值。 如果他们真的 让客户既感到印象深刻又感受到社交媒体 领先竞争对手,并以好的方式将 产品化,这几乎是显而易见的。而如果他们没有投入额外的 ~ 亿美元的资本支出,却因此错失了这个机会,后果可能是存在性风险。
对于这些大公司来说,每家企业的业务都有可能被 技术深度颠覆。所以对他们来说,风险和回报非常清晰。更战术层面上,他们也能够轻松收回资本支出。最坏的情况下,他们可以通过使核心业务更高效来实现这一点。 比如说,Febook 广告中的 G
PU 利用率? 是的,比如 Febook 或 Googe,他们的广告系统只 AZB 目录 要稍微改进一点,就可以回收数十亿美元的成本。 通过更好的性能? 是的,苹果也可以通过推动一个设备升级周期轻松回收投资。我认为这些都相当清晰。 从整个行业来看,这些公司投入大量资本对行业是有益的,尤其是像 Googe 和微软这样的公司,它们还在出租计算资源。