九妖小说网

手机浏览器扫描二维码访问

本站弹窗广告每日仅弹出一次
尽可能不去影响用户体验
为了生存请广大读者理解

openai:从“会聊天的机器人”到改变世界的公司(第3页)

这些数据从哪来?主要有三个渠道:

- 公开的网站:比如维基百科、百度百科、各种新闻网站、博客(只要是没加密、能公开看的文字,都会被收集);

- 书籍和论文:比如图书馆里的经典书籍、学术数据库里的论文(当然,会避开有版权的内容,或者跟版权方合作);

本小章还未完,请点击下一页继续阅读后面精彩内容!

- 对话数据:比如以前人们和其他AI聊天的记录、公开的论坛对话(比如 Reddit 上的帖子),用来教AI“怎么聊天”。

收集来的数据有多少?说出来你可能不信:训练GPT-3(ChatGPT的前一代)时,用了大概45TB的数据——相当于把10万部电影的文字内容,或者1000亿页小说,全部塞进AI的“大脑”里。

但这些数据不是“直接用”的,还得“洗菜”:比如去掉脏话、错误信息(比如“地球是平的”这种谣言)、重复内容(比如网上反复转载的同一篇文章),不然AI学了坏东西,就会“说胡话”。这一步很枯燥,但很重要——就像你买菜回来,得把烂叶子摘掉、把泥土洗干净,不然做出来的饭会难吃。

第二步:“做饭”——用超级电脑“炒”出AI模型

食材准备好,接下来就是“做饭”——这一步是OpenAI最核心的技术,也是最烧钱的地方。

这里的“锅”,就是“超级电脑”:OpenAI用的是微软Azure的云服务器,里面有上万颗“GPU芯片”(相当于电脑的“大脑”)。这些芯片同时工作,才能处理几十TB的数据——你可以理解成“用1000口锅同时炒菜”,速度快,但电费和硬件费也贵得吓人。

这里的“菜谱”,就是“算法”:简单说,就是告诉AI“怎么从数据里学知识”。比如,AI看到“猫”这个词,算法会让它记住“猫有四条腿、会喵喵叫、喜欢吃鱼”;看到“今天天气很好,我想去公园”这句话,算法会让它明白“‘天气好’是‘去公园’的原因”——相当于教AI“怎么理解文字的意思,怎么组织语言”。

这个“做饭”的过程,叫“训练模型”。训练一次GPT-3,大概要花几个星期,电费就得几千万美金;训练GPT-4,成本更高,有人估算得几亿美金——这也是为啥只有微软这样的大公司,才能撑得起OpenAI的研发。

而且“做饭”不是一次就能成功的:比如第一次训练出来的AI,可能会“答非所问”(你问“今天吃啥”,它答“地球是圆的”),这时候工程师就得调整“菜谱”(改算法),再重新“炒一次”(重新训练),有时候得反复几十次,才能让AI“说话正常”。

第三步:“试吃”——让人类教AI“怎么说话更得体”

饭做好了,得有人试吃,看看咸不咸、辣不辣;AI训练好了,也得有人“试聊”,教它“怎么说话更得体”——这一步叫“人类反馈强化学习(RLHF)”,说穿了就是“让人类当AI的老师”。

具体怎么做?OpenAI会找一群“标注员”(普通人也能做,只要通过考核),让他们跟AI聊天,然后给AI的回答打分:

- 如果AI回答得好(比如你问“怎么缓解焦虑”,AI说“可以试试深呼吸、听音乐,要是严重的话建议看医生”),就给高分;

- 如果AI回答得不好(比如你问“怎么缓解焦虑”,AI说“别焦虑,焦虑没用”),就给低分,还得告诉AI“为啥不好,应该怎么改”。

然后OpenAI会把这些“打分数据”再喂给AI,让AI学习“什么样的回答更受欢迎”——相当于你试吃后说“太咸了,下次少放盐”,厨师下次就会调整。

热门小说推荐
异界始皇

异界始皇

异界始皇情节跌宕起伏、扣人心弦,是一本情节与文笔俱佳的武侠修真小说,异界始皇-胡道非道-小说旗免费提供异界始皇最新清爽干净的文字章节在线阅读和TXT下载。...

跌入温床

跌入温床

*老实人下属攻x小少爷诱受 游子意前二十五年的人生锦衣玉食,性格骄纵乖张。 谁承想家中突然破产,家产被尽数拍卖。全家移居海外,独留他一个人在国内。 在他走投无路的一个晚上,突然收到了一条短信: “你如果没地方住,可以暂住到我” 落款:谢东城 游子意没当回事:现在诈骗短信这么智能了?这人谁啊? 谢东城:你曾经的司机。 游子意本意只想在他家过渡几天。 结果某天不小心看到了谢东城漂亮的肌肉线条。他突然觉得自己再多住一段时间,也未尝不可。 谢东城在意游子意和谁交朋友、跟谁来往。除了独自生闷气,却没有更多表示。 直到一个深夜,游子意拽住谢东城的衣领,一下跨坐到他的大腿上。 “你确定,你真的对我没感觉吗?” *大概是一起白手起家、努力搞钱然后谈谈恋爱的故事。...

全职法师

全职法师

全职法师情节跌宕起伏、扣人心弦,是一本情节与文笔俱佳的玄幻魔法小说,全职法师-乱()-小说旗免费提供全职法师最新清爽干净的文字章节在线阅读和TXT下载。...

短篇小说集合1

短篇小说集合1

一种境界一览众山小目的就是使自己的心情达到一种舒畅或平静的状态。在这起伏间领悟智慧的不朽,找到内心安宁,抵达精神的绿洲“横看成岭侧成峰,远近高低各不同。”这句诗此刻会在你的精神绿洲中回响。就像看一座山,从不同的角度去看,会有不同的景象。我们总是习惯从自己的立场去看待这篇小说,却很少真正站在其他的角度去理解和感受。对......

小花成熟时

小花成熟时

[一]温杭刚回总部,公司空降新上司,吹毛求疵,尖锐冷硬,最无语的是,还是她拒绝过的假男友。她每天挣扎考核,谨小慎微,生怕惹到这位大老板。职场上两人互看不顺,从争锋相对到不清不楚,谁都没有捅破...

温水煮鱼

温水煮鱼

温柔腹黑X傲娇炸毛 陆瑾瑜,叁才娱乐小太子,进娱乐圈之后一直是资源不愁,星途风顺。 进组前,陆瑾瑜在主创见面会上遇见了一位面如冠玉的长腿美男。色心忽起,一番勾搭,岂料和美人撞了型号。 陆瑾瑜:…… 行吧,看你长得好看,我让你1回。 结束之后,大美人不仅没走,还想留个联系方式。 见惯了娱乐圈心机上位的小明星,陆瑾瑜想当然讽道:“怎么?这是想求包养?” …… 之后叁才娱乐财务危机,陆瑾瑜资源下滑,正在拍的电影也面临被换角,他只好去见大投资商温如许。 那晚技艺高超的大美1,此刻正眼尾带笑地看着他,“怎么?这是来求包养?” 陆瑾瑜:…… 想骂人。 温如许×陆瑾瑜/陆鱼 温柔腹黑美人攻×炸毛傲娇憨憨受 Tips: 受真名叫陆鱼,艺名陆瑾瑜。 Ps: 作者不追星,不混饭圈,人物无原型,拒绝ky。弃文不必告知,你好我好大家好。天天开心谢谢(●?З`●)...