【小哈划重点:用户在电脑版选择DeepSeek模型并关闭深度思考后,输入“@AI编程”后,即可通过双栏界面,在左侧对话生成代码,右侧实时展示并支持预览运行,编程效率显著提升。目前,该功能现已在元宝电脑版2.25版本上线。】
红杉中国正式开源AI基准测试xbench评测集
界面新闻 4小时前
6月18日,红杉中国正式开源其AI基准测试工具xbench的两个评测集xbench-ScienceQA和xbench-DeepSearch。红杉中国表示,未来将基于大模型和AI Agent的发展情况不断动态更新评测集,并且采用“黑白盒”机制,既保证xbench的发展可以服务更多的大模型和Agent开发者,同时尽力避免静态评测集经常出现的过拟合问题,确保xbench的长期有效。
腾讯元宝更新:支持双栏AI编程,可直接预览运行
36氪 2025-06-17 16:29
6月17日,腾讯元宝发布更新,上线AI编程模式。用户在电脑版选择DeepSeek模型并关闭深度思考后,输入“@AI编程”后,即可通过双栏界面,在左侧对话生成代码,右侧实时展示并支持预览运行,编程效率显著提升。目前,该功能现已在元宝电脑版2.25版本上线。