【小哈划重点:相比过去制造行业大模型检测的单一场景,在OpenAI发布的研究文章中,ChatGPT具备构建“感知-执行”循环的能力,该能力未来将应用于更广泛的工业领域。研究显示,将计算机视觉模型访问权加入ChatGPT函数库后,ChatGPT可以探索未知环境,通过计算相对目标角度,最终导航到用户指定目标。】
ChatGPT因其接近人类水平的自然语言回答而再次掀起了人工智能的浪潮。在机器人领域,由于ChatGPT出色的问答交互能力,其应用首先与服务类机器人、人形机器人联想到一起。但ChatGPT的大模型能力不止于作为插件安装在机器人中输入、输出自然语言,其真正魅力在于打破了自然语言与机器物理世界的屏障。改变人类间交流方式之余,ChatGPT还可以改变人类与机器的交流方式。
工业机器人是广泛用于工业领域的多关节机械手或多自由度的机器装置,具有一定的自动性,可依靠自身的动力能源和控制能力实现各种工业加工制造功能。一般工业机器人被广泛应用于电子、物流、化工等各个工业领域之中。在过往60年,随着智能化传感器的加入和计算机技术的发展,工业机器人从简单的单一功能发展成具有感知、执行和决策能力的机器人。时至今日,AI技术的突破,特别是ChatGPT的出现,我们认为工业机器人将迎来智能化发展的新阶段。
OpenAI于2023年2月20号发布了一篇名为《ChatGPT for Robotics: Design Principles and Model Abilities》的论文。此外,近期业界和学界的专家们对于ChatGPT在工业机器人方面的应用,也有了一定的设想和讨论。在此基础上,结合前人的研究成果,我们对ChatGPT在工业机器人中的潜在应用进行了简要的阐述,为各位提供更广阔的想象空间。
01
使工业机器人理解非专业人类语义并编程
当前的机器人技术依赖于机器人与工程师之间紧密的反馈循环,工程师负责编写任务代码、观察机器人的行为并通过编写额外的代码来纠正错误。
在微软的愿景中,ChatGPT可以将描述目标任务的人类自然语言翻译为机器人的代码。这将有可能实现非技术用户代替工程师,人们只需使用自然语言提供原始任务描述、观察机器人并提供有关机器人行为的任何反馈。同时,ChatGPT可以通过人类语言的多次输入和对话,将语义转化为代码以改进行为。
在该情境下,微软尝试了零样本任务规划案例,使非专业使用者得以使用ChatGPT准确指挥无人机巡检货架内容。无人机导航任务代码结构复杂,而ChatGPT可以通过用户不完全清晰的定义指令编写机器人代码,并在必要时请求进一步清晰阐释,最终直接生成可用代码,实现“无代码编程”。
机器人使用的现在和未来
02
增强工业机器人信息处理分析能力
在信息处理与分析方面,ChatGPT可以与数据分析师进行交互,以帮助他们分析和可视化工业生产数据,或者可以集成到生产线中,以帮助操作员完成多种任务。例如,为设备操作提供详细的步骤说明,帮助操作员在实际操作中遵循正确的程序,以确保生产设备的正常运行。ChatGPT还可以用于监控生产质量,通过向运营商提供有关如何改进质量的反馈,以提高产品质量。此外,当生产出现故障时,ChatGPT还可以提供快速诊断和解决方案,帮助运营商快速解决问题,从而提高生产效率。
例如,在产线繁多的电子制造业,工艺复杂度和精度要求较高,通常需要垂直场景的专业化应用。此前,产线工艺的缺陷检测是应用最广泛的领域。百度其实早期已经布局工业领域的大模型算法,2022年底,百度联合深圳燃气、吉利、泰康保险、TCL、上海辞书出版社发布5个行业大模型。其中,联合TCL合作搭建的文心电子制造行业大模型,在TCL两个产线检测mAP指标平均提升10%以上;能够在训练样本减少到只有30%-40%的情况下,达到原有产线效果;新产线的冷态起动效果可以提高至原来的3倍;产线投产的研发时间缩短了30%。
03
赋予工业机器人更强大的感知执行能力
相比过去制造行业大模型检测的单一场景,在OpenAI发布的研究文章中,ChatGPT具备构建“感知-执行”循环的能力,该能力未来将应用于更广泛的工业领域。研究显示,将计算机视觉模型访问权加入ChatGPT函数库后,ChatGPT可以探索未知环境,通过计算相对目标角度,最终导航到用户指定目标。
具体来说,模型首先通过API库输出拥有“感知-执行”循环结构的代码,之后准确使用图像采集和目标检测等感知函数来提取机器人导航和控制的相关信息,并通过文本对话不断将观察(描述文本或者极坐标)输入到ChatGPT。最终ChatGPT将能够解析这一观察流并输出相关的动作。目前,研究中ChatGPT的返回值仅包含向前的运动距离和转弯角度,因此仅用于验证模型能够完成简单的导航任务。对于更复杂的任务和环境,在以文本或向量形式适当描述场景环境方面还需要更多的研究。
04
更多潜在应用方向
除了以上研究和验证之外,ChatGPT还有以下这些可能的应用方向:
生产线的交互协调:ChatGPT可以通过语音或文本与工人进行交互,通过这些交互帮助工人协调生产线的运行,从而提升工作效率和质量。同时,它还可以为工人提供所需的信息和帮助,以帮助他们更好地完成工作任务。
产品设计与检测:通过与工程人员、设计师的合作,ChatGPT能够有效地收集和分析新产品及其生产过程的数据,及时发现问题并提出有效的改进措施。此外,ChatGPT还能利用仿真结果对产品进行测试和优化,从而实现更好的产品设计和质量控制。
员工教育与培训:ChatGPT能够对员工操作各类自动化控制系统进行训练,从而提高他们的技能水平,更好地维护与管理流水线与设备。同时,它还可以提醒员工进行例行的维护工作,从而确保机器人与各类自动化设备能够正常运行,提高生产效率。
……
总结来说,虽然ChatGPT在工业机器人领域为世界打开了新思路,但目前研究的场景环境均相对简单。一方面,ChatGPT学习和转化人类自然语言的能力已经有所证明,为工业机器人带来了新的希望和发展空间;另一方面,如何进一步在大模型浪潮中,成功商业化落地,也成为了工业机器人领域的新挑战。