美国风险投资公司Madrona的合伙人Jon Turow近期发表了一篇《AI Agent基础设施的兴起》,分享他对Agent领域的观察和思考。工具使用(Tool Use)和个性化记忆(Personalization Memory)是目前AI Agent最重要的基础设施。
狗这块主要是三部分市场,一是纯消费者,买来玩的,或者做一点简单的教育编程。还有一种是教育科研类的,各种高校或者公司买来做一些科研研究,发表论文,或者做一些教学。还有一种就是行业应用,比如说电网巡检,一些发电厂、化工厂的巡检。
至于丰田全球车型,可以确定的是Momenta将以算法软件供应商的角色出现,华为硬件供应商的位置则是由高通与国内智驾域控头部德赛西威代替,其中高通提供智能驾驶芯片,德赛西威提供集成域控。
Hasani 表示,目前,Liquid AI 没有计划为消费者开发像 ChatGPT 这样的应用程序。公司首先关注希望为金融和医学研究建模的企业客户。
5月8日,OpenAI公布了其《模型规范(Model Spec)》的初版,明确AI模型在OpenAI API和ChatGPT中的“行为准则”,公司称这一举措是塑造理想模型的方法之一。《模型规范》提出了三个基本概念,分别是模型的目标原则、规则制定以及默认行为准则。
5月10日,极客公园创始人&总裁张鹏、推出国内第一款融入大语言模型的搜索引擎-天工AI搜索的昆仑万维董事长兼CEO方汉,和投资了最近几个月数据飙升的秘塔搜索的猎豹移动董事长兼CEO、猎户星空董事长傅盛,共同聊了聊这个话题。
一边彭博社曝出猛料:苹果马上要跟OpenAI签署协议,将ChatGPT相关技术用在iPhone里。另一边,《纽约时报》曝出苹果Siri即将发布的一系列重磅生成式AI升级、背后研发细节,以及苹果顶层高管做出要给Siri做“大脑移植”这一决定的幕后原因。
特斯拉第一季度财报电话会议实录:非自动驾驶将像翻盖手机一样。财报发布会,特斯拉举行了电话会议,以下为实录。注:内容为AI翻译,未经校对,仅供参考。
操作复杂学不会,3分钟后过热关机,太慢、太笨、没反应,室外压根看不清……看来,智能手机要被淘汰,还得再等一阵子。
2021年夏天,OpenAI悄然解散了它的机器人团队,理由是缺乏训练机器人使用人工智能进行移动和推理所需的数据,研发受到了阻碍。
作者是澳大利亚悉尼麦考瑞大学的哲学讲师拉斐尔·米利埃尔(Raphaël Millière),他主要从事AI、认知科学和心智哲学等方面的学术研究。以下是对该文章的全文编译,由于篇幅原因进行了部分删减。
在公司技术会上,工程师展现了对文生视频的热情,试着说服他应该尝试。这让王小川有点生气。“大家没有站到更长远的角度考虑终局,我到底在干嘛?”在他看来,要么Sora靠近AGI理想,要么靠近现实场景,但它“两个都不靠”。
吴育昕和杨植麟一样,先后毕业于清华和CMU,研究方向为计算机视觉中的检测和识别问题。毕业后他先是在Meta的FAIR工作,曾和AI大神何恺明共同提出组归一化(GN)的方法。
丰富的视觉信息涵盖了语言无法表达的很多信息,它可以捕捉到物体的运动、形态的变化、环境的变化等现象,可以为人类提供更加直观和全面的认识。同样,在科学研究、工程设计、医学诊断等领域,视频数据的应用也已经成为解决复杂问题的重要手段之一。
Sora这个名字取自日语单词,意为“天空”,引申含义还有“自由”。在Sora官网页面,无数只纸飞机在自由飞翔,行动自主,最后汇集成一片天空的背景色。
Greg在推特中表示,目前的医疗体系都是针对各个专科建立的。hEDS要看的医生可太多了。研究人员在Nature上联合提出了一种全新的医学人工智能范式,即「全科医学人工智能」,可以灵活地编码、整合和大规模解释医学领域的多模态数据,比如文本、成像、基因组学等。
联袂北京大学,发布了通用人工智能评级标准与测试平台(TongTest),定义了通用人工智能三个基本特征,即实现无限任务、自主生成任务、价值驱动且能实现价值对齐。
简单来说,就是让机器人自己在房间、办公室等环境进行自行操作和观察,到处看看有啥可以操作的东西。它会先把当前环境里的桌子、杯子这些物体定位好,明确具体的坐标,方便以后的动作指令操作。
今年来,很多VC/PE都成立了专门的招商团队,专门对接政府、地方的招商需求。为了满足地方政府的返投或招引要求,机构们也是不得不把办公室搬到三四线城市。
机器能思考吗?你建议,如果一个人在经过五分钟的询问后仍无法分辨自己是在与人工智能(AI)机器还是另一个人交谈,这将证明人工智能具有类似人类的智能。这就是你所提出的用于确定计算机是否在思考的思想实验,你把这个实验叫作“模仿游戏”,但后来它以“图灵测试”(Turing Test)著称。
大模型本身更倾向于TPF——在更加侧重基础研究和理论创新的论文领域,拥有充足研究资源的高校和科研院所占据绝对主导。相比之下,企业的创新具备浓厚的PMF特质。在专利领域,百度以6000余项专利的绝对领先优势超越了所有高校与科研院所排在第一位。
贝索斯觉得现在的大语言模型更像是「发现」而不是「发明」,因为它们不是完全可控,常常会让人感到惊喜......最近,贝索斯在著名科技播客「Lex Fridman Podcast」上聊了两小时,分享了自己在蓝色起源的工作、对生成式 AI 的见解,以及更多关于管理的思考。
一进入Pika,你就能看到一个非常空旷的界面。PIKA 1.0支持3种方式生成视频:文生视频、图生视频、视频转视频。没排队的,可以先去https://pika.art排队。
使用他们提出的最新提示策略Medprompt,在医疗专业领域,GPT-4在MultiMed QA九个测试集中取得最优结果。在MedQA数据集(美国医师执照考试题)上,Medprompt让GPT-4的准确率首次超过90%,超越BioGPT和Med-PaLM等一众微调方法。
不仅能根据文字、图片或视频风格生成视频,还能对视频局部进行编辑。斩获5500万美元融资,其中个人投资者不乏各种大牛,如Quara创始人Adam D’Angelo、Perplexity的CEO Aravind Srinivas、GitHub前CEO Nat Friedman等等。