联手OpenAI，吴恩达推出一门o1推理新课程，还免费

小舟 ☉ 文来源：机器之心 2025-01-07 @ 哈希力量

【小哈划重点：具体来说，在Reasoning with o1课程中，学生将了解OpenAI如何利用强化学习来构建使用「测试时计算」来提高推理任务性能的模型；了解什么是「思维链」提示，以及o1如何自主地利用它来将问题分解为更小的步骤，尝试多种策略，并在回答问题之前仔细思考。】

在刚刚过去的2024年，OpenAI推出了o系列模型。相比于以往大型语言模型，o系列模型使用更多的计算进行更深入的「思考」，能够回答更复杂、更细致的问题。

通过在推理时执行思维链推理，o系列模型在新兴用例中表现出色，包括多步骤规划、图像推理和长期编码。那么，具体如何使用o系列模型来构建需要复杂推理的应用程序呢？

最近，OpenAI联合人工智能著名学者、斯坦福大学教授吴恩达推出了一门关于使用o1进行推理的免费DeepLearning.AI课程——Reasoning with o1，讲师是OpenAI战略解决方案架构主管Colin Jarvis。

课程地址：

Reasoning with o1课程内容主要包括：

- o1即时工程的基础知识

- 规划和执行多步骤任务

- 创建和编辑代码

- 图像推理

- 可提高模型性能的Metaprompting

通过这门课程，学生将：

- 了解o1、它的工作原理、性能以及使用它的最佳场景。

- 了解如何有效地提示o1以及何时将任务委派给更具成本效益、更低延迟的模型。

- 了解o1如何在编码和视觉推理任务上表现出色，以及如何应用Metaprompting来优化应用程序。

具体来说，在Reasoning with o1课程中，学生将了解OpenAI如何利用强化学习来构建使用「测试时计算」来提高推理任务性能的模型；了解什么是「思维链」提示，以及o1如何自主地利用它来将问题分解为更小的步骤，尝试多种策略，并在回答问题之前仔细思考。

o1模型特别擅长抽象推理任务。它在规划、编码、分析、特定领域推理（如法律）和STEM科目等任务上具有破纪录的性能。Reasoning with o1课程内容涵盖：

- 学习识别o1模型适合哪些任务，以及何时需要使用更小或更快的模型，或将这两者结合起来。

- 了解使用o1进行提示的四个关键原则，并探索性能上的差异。

- 实现一个多步骤任务，其中o1作为协调器创建规划并将其交给4o-mini模型按顺序执行规划，平衡智能和成本之间的权衡。

- 使用o1执行编码任务，构建新应用程序、编辑现有代码，并通过在o1-mini和GPT 4o之间运行编码竞赛来测试性能。

- 使用o1进行图像理解，并了解它如何通过层次推理获得更好的性能，其中它会预先产生延迟和成本，预处理图像并使用丰富的细节对其进行索引，以便稍后用于问答。

- 学习一种称为Metaprompting的技术，以使用o1来改进提示。

怎么说？来学习吗？

编辑：小舟

https://mp.weixin.qq.com/s/J4uQWL_zccyW7PKsb8eSlw

收录来源链接或附上。内容并不代表投资建议。

本文收录后固定可引用URL链接

http://www.haxililiang.com/xueyuan/peixun/37115.html

☉ 文库同一主题内容智能推荐 ☉

哈希力量 ☉ 通用人工智能文库