每日一看大模型新闻(2023.12.01-12.03)阿里巴巴:推出AI动画生成框架;微软获得OpenAI董事会席位,奥特曼回应泄密事件;昆仑万维:发布Agent开发平台天工SkyAgents

avatar
作者
筋斗云
阅读量:0

1.产品发布

1.1昆仑万维:发布Agent开发平台天工SkyAgents

发布日期:2023.12.01

昆仑万维发布天工SkyAgents,零代码打造AI智能体

主要内容:昆仑万维正式发布了天工SkyAgents平台。据介绍,天工SkyAgents是国内领先的AI Agent开发平台,基于昆仑万维天工大模型打造,具备自主学习和独立思考能力,涵盖感知、决策和执行的全流程。用户可以通过自然语言构建个人或多个"私人助理",并将不同任务模块化,通过操作系统模块实现问题预设、指定回复、知识库创建与检索、意图识别、文本提取、HTTP请求等任务。对于企业用户而言,天工SkyAgents可按需组装成多种个性化应用,如企业IT、智能客服、企业培训、HR、法律顾问等,并支持一键服务部署,确保与不同业务系统的无缝集成。

内测地址:首页 | AutoAgents

开放平台地址:天工开放平台

1.2阿里国际发布3款AI设计生态工具

发布日期:2023.12.01

阿里国际发布3款AI设计生态工具

主要内容:在第六届中国国际工业设计博览会上,阿里国际数字商业集团发布了三款设计生态工具:堆友、Pic Copilot、鹿班AI。这些工具提供了AI绘画、AI模型创作、AI图像和视频处理等功能。据报道,这三款产品已经为数十万商家提供服务,覆盖了50万设计师。此外,工信部国际经济技术合作中心与阿里国际设计签署了框架协议,共同推动数智设计的发展。

堆友:堆友

Pic Copilot:https://www.piccopilot.com/

鹿班AI:鹿班 - 让设计更美好

1.3奇妙元推出奇妙助手功能

发布日期:2023.11.30

效率加倍,专为创作者定制的新功能来了!

主要内容:出门问问旗下的AI数字人视频创作平台奇妙元进行了全面升级,并推出了奇妙助手功能。据介绍,奇妙助手可以快速生成制作视频所需的素材,为短视频生成高质量的图片,内置了8种风格和3种尺寸比例。它还可以基于大模型能力智能生成文本,支持中英双语和多种语言情绪。此外,用户可以上传PPT并一键生成讲解视频,搭载智能解析功能,重点提炼内容。奇妙助手还提供一站式生成数字人视频的功能,提供海量的模板素材供选择。同时,它还可以一键提取视频台词,支持在线视频链接和本地视频上传,准确率达到99%。数字人商店新增了33+个形象,模板商店也更新了大量的剪辑模板素材。

2.技术更新

2.1 Meta开源实时翻译系列模型Seamless

发布日期:2023.12.01

https://ai.meta.com/blog/seamless-communication/?utm_source=twitter&utm_medium=organic_social&utm_campaign=fair10&utm_content=video

主要内容:Meta推出了实时翻译系统Seamless。为了构建Seamless,Meta开发了两个模型:SeamlessExpressive用于保留语音到语音翻译的表达能力,SeamlessStreaming用于提供几乎无延迟的流式翻译结果。这些模型都是基于Meta在8月发布的基础模型SeamlessM4T v2构建的。SeamlessExpressive解决了之前在表达性语音研究中尚未开发的韵律方面的问题,如语速、节奏停顿,同时保留了情感和风格。目前,这些元素在英语、西班牙语、德语、法语、意大利语和中文之间的语音到语音翻译中得到保留。SeamlessStreaming支持近100种输入和输出语言的自动语音识别和语音到文本翻译,以及近100种输入语言和36种输出语言的语音到语音翻译。Meta已经开源了这四个模型,以便研究人员可以在此基础上进行进一步的研究。

开源地址:https://github.com/facebookresearch/seamless_communication

Demo地址:https://seamless.metademolab.com/expressive

2.2阿里巴巴:推出AI动画生成框架

发布日期:2023.12.01

阿里推出AI动画生成框架 从静态图像生成动画 - 智东西快讯

主要内容:阿里巴巴的研究团队发布了一篇论文,他们利用扩散模型的能力提出了一个名为Animate Anyone的新框架,专门用于角色动画。这个框架可以从静态图像中使用AI生成动态视频,从而实现对任意角色的动画化。为了保持参考图像中复杂外观特征的一致性,研究团队改进了ReferenceNet算法,并通过空间注意力融合了详细特征。为了确保动画的可控性和连贯性,他们引入了一个高效的姿势指导器来指导角色的动作,并采用了一种有效的时间建模方法,以确保视频帧之间的平滑过渡。

论文地址:https://arxiv.org/pdf/2311.17117

项目主页:Animate Anyone

3.商业动态

3.2阿里云首届通义千问AI挑战赛

发布日期:2023.12.02

50万奖励,阿里云办了场AI挑战赛,邀你畅玩通义开源家族_模型_机器人_开发

主要内容:在通义千问发布会上,阿里云宣布首届“通义千问AI挑战赛”正式开赛。参赛者可以免费使用通义开源模型家族,其中包括最新发布的720亿参数模型Qwen-72B。该挑战赛分为算法和Agent两个赛道。算法赛道旨在通过微调训练通义千问大模型来探索开源模型的代码能力上限。Agent赛道则要求参赛者基于通义千问大模型和魔搭社区的Agent-Builder框架开发新一代AI应用,以促进大模型在各行各业的实际应用。现在起,开发者可以通过天池平台报名参赛,主办方将提供价值50万元的免费云上算力和奖金给参赛者。

比赛地址:天池大数据竞赛_天池大赛-阿里云天池

3.3微软获得OpenAI董事会席位,奥特曼回应泄密事件

发布日期:2023.12.01

微软拿下OpenAI董事会席位,奥特曼首次回应Q*:不幸的泄密事件-36氪

主要内容:在OpenAI董事会事件的大结局中,微软成功获得非盈利机构OpenAI的董事会席位。新董事长Bret Taylor宣布,微软将成为董事会的“观察员”,这也是微软首次进入OpenAI的董事会。

尽管OpenAI首席科学家Ilya不再担任董事会成员,但奥特曼表示对他没有“零恶意”,并希望继续与他合作。泄密事件的存在被奥特曼称为“不幸的泄密事件”。

新董事会的成员包括微软的观察员(人选待定)、Bret Taylor、Larry Summers和Adam D’Angelo。OpenAI员工在风波中展现出团结,最终没有失去员工,三名曾辞职的员工也回归。整个事件过后,OpenAI董事会将加强公司治理,进行独立审查,以确保持续致力于使命。

广告一刻

为您即时展示最新活动产品广告消息,让您随时掌握产品活动新动态!