“O”:视频输出。2023年,我们看到了文字到视频合成的浪潮:WALT(谷歌)、EmuVideo(Meta)、Align Your Latents(英伟达)、Pika等等,数不胜数。然而,大多数生成的片段仍然很短。我将它们视为AI视频的“系统1”——“无意识”的局部像素运动。
多模态模型将更多地用于文档处理(但首先需要降低成本/延迟)。
悉尼科技大学的科研人员,通过大语言模型、EEG(大脑活动检测工具)、脑机接口等技术,开发了一个可自动读取人类想法,并转化成文本的AI大模型——DeWave。
DeWave使用了事件标记来将脑电波分割成单词级别的特征,这可能导致在没有标记的情况下无法准确地对脑电波进行分割和翻译。
站长之家(ChinaZ.com)1月3日 消息:Inpaint_wechat 微信小程序已经上线了!这是一款基于微信AI能力的微信小程序,它可以实现图片选定区域的消除修复功能,并且是纯客户端实现,无需服务端的支持。