你的位置:九游会(中国区)集团官方网站 > 新闻动态 > J9九游会若是你给它迷漫的落魄文-九游会(中国区)集团官方网站
发布日期:2026-03-16 06:39 点击次数:189

苹果 &SpaceX 前工程师共享 o1 使用心得J9九游会,奥特曼、Brockman 齐转发了。
划要点:
o1 仍是不是聊天模子了,需要全新的使用身手。


奥特曼还跑去挖坟作家Ben Hylak数天前的"自我打脸"批驳,称"不雅察 o1 的口碑变化、以及东谈主们学习怎样使用它很趣味趣味"。

Ben Hylak 曾任 SpaceX 软件工程师、苹果 VisionOS 东谈主机交互筹商师,咫尺在创业为 AI 居品提供分析就业。
具体来说,Ben 在 o1 pro 推出满血 $200/ 月版块的第一天就交钱了,整整测试了一天后得出论断:它确凿很晦气!
每次发问齐要恭候 5 分钟
会输出首尾乖互的建议
莫得条款但老是会回应架构图 + 上风 / 残障列表

Ben 把晦气的体验发在网上后,许多东谈主默示同感。但趣味趣味的是,也有东谈主热烈反对。
他开动与捏不同不雅点的筹商,然后缔结到蓝本是我方的身手实足错了。
我还在把 o1 当聊天模子来用,但 o1 仍是不是聊天模子了。
当今,Ben 仍是从歧视 o1,转造成了每天齐在用它处理最症结的问题。
像对待新职工相通对待 o1
若是说 o1 不是聊天模子了,那它当今是什么?
Ben 合计它就像一个"阐明生成器"。若是你给它迷漫的落魄文,并告诉它你想要输出什么,它频繁会一次性找到处理决议。
OpenAI 官方其实给了一个简便的 o1 使用建议,但并不完善。

Ben 的建议包括:
提供海量配景信息
不论你当今是奈何理会"海量"的,再乘以 10 倍。
当使用 GPT-4o 或 Claude 3.5 等聊天模子时,频繁会从一个简便的问题和一些配景信息开动。若是模子需要更多配景信息,它频繁会条款你不竭提供。
这等于聊天模子的本色,从一来一趟的交互中不断完善输出。
但 o1 只会从名义上回答你建议的问题,不会试图从你那边得到配景信息。是以需要反过来将尽可能多的落魄文主动发给它。
即使仅仅问一个简便的代码工程问题,应该提供:
阐明所有这个词你尝试过但不起作用的决议
一份无缺的数据库 schemas
阐明一下你的公司是作念什么的,边界多大,界说里面术语
一言以蔽之,就像对待新职工相通对待 o1。

刻画你想要什么,而不是指引它怎样作念
关于大大量聊天模子,咱们齐会告诉模子但愿他怎样回应情势,比如"上演一位软件工程民众,请仔细念念考"。
但在 o1 上灵验的身手正相背,告诉它你需要什么,而不是指引它怎样去作念。
Ben 把 o1 的教唆词模板分红 4 部分:
主义放在最前边
详备指定输出步地
不错附加需要检查的注释事项
海量关联的配景信息

临了,o1 的输出有一种学术 / 交易阐明的立场。Ben 合计太多的推理 token 让它很难开脱这种立场
他曾试图让 o1 来完成这篇著述,但历程屡次尝试,只可得到越过无为的学生功课。

One More Thing
在奥特曼的转发推文中,有东谈主套出了最新音讯:
o3 暂时还不会向用户灵通,o3-mini 会先推出,并且时辰不远了。

o3-mini 会先提供给 Plus 订阅用户使用,API 的订价 OpenAI 里面还没细目,但不会很贵。

参考衔接:
[ 1 ] https://www.latent.space/p/o1-skill-issue
[ 2 ] https://x.com/sama/status/1877814065088663763
[ 3 ] https://x.com/gdb/status/1878489681702310392J9九游会
Powered by 九游会(中国区)集团官方网站 @2013-2022 RSS地图 HTML地图