资源分享

提升效率的秘密武器:10款AI智能PDF解析工具

PDF文件已成为最常用的文件格式之一,无论是学术文献、业务报告还是政府文件,都广泛采用PDF格式

OpenAI斥巨资收购Rockset,实时数据分析能力再度升级

Openai 在周五宣布已收购企业分析初创公司 Rockset,以“为我们跨产品的检索基础设施提供支持”。

V2A:Google推出的自动同步视频内容的音频生成技术

Google DeepMind最近发布了一项名为V2A(Video-to-Audio)的技术,V2A能够根据视频画面和文字描述自动生成与视频内容同步的音频,也就是给 ai 视频自动配音、...

Hallo:音频驱动的分层视觉合成,让图像动起来

Hallo,可以根据单张图像和音频输入生成唱歌和说话视频,并能控制人物表情和姿态

ProTeus:用一张图片打造栩栩如生的数字人化身

ProTeus是由斯坦福大学的研究人员和Apparate Labs共同开发的ai模型,只需要一张图片就能生成生成笑、说唱、唱歌、眨眼、微笑、说话高度逼真和具有表现力的虚...

Follow-Your-Emoji表情随心动:打造你的个性化肖像动画

Follow-Your-Emoji,由港科大、腾讯混元、清华共研,基于扩散模型共同开发,将目标表情或动作应用到参考肖像上,并保持肖像的身份特征、动作连贯性及逼真度。

Agent Hospital:全球首家虚拟AI医院

Agent Hospital,一个虚拟的ai医院,清华大学的研究人员最近在这个虚拟世界中创建了“代理医院”,所有医生、护士和患者都由可以自主交互的大型语言模型(LLMs...

必备神器:10款字幕生成与编辑工具推荐

字幕生成工具能准确识别视频语音并自动转换成文字,字幕制作软件提供时间轴编辑、文字内容和样式排版等功能,内置多种字幕样式模板,方便用户快速设置美观的...

NVIDIA重磅发布:全新数字人技术NVIDIA ACE

NVIDIA发布数字人:NVIDIA ACE,可以让游戏NPC具有ai对话功能,同时能直接生成数字人的语音和面部动画!

ViViD:扩散模型虚拟试穿视频技术

ViViD 是阿里巴巴开发的一项视频虚拟试穿技术,能够在视频中自由地替换人物的衣服。
1 2