jiuyou.com-谷歌发布全新PaliGemma 2视觉模型 能识别人们的情绪
日期:2026-05-01

【JIUYOU科技动静】于浩繁为人工智能(AI)付与“视觉”能力的模子中,google的PaliGe妹妹a模子盘踞一席之地。作为google的视觉语言模子,它可以或许辨认图象中的物体及文字。近日,google正式推出了全新的PaliGe妹妹a 2模子,并已经投入利用。

谷歌发布全新PaliGemma 2视觉模型 能识别人们的情绪

PaliGe妹妹a初代模子已经是一款实用的东西,可以或许辨认图象中的物体,并为图象添加字幕,甚至还有能为短视频添加字幕。PaliGe妹妹a的一个更为实用的功效是可以或许回覆关在图象的问题。是以,它是一款功效强盛的综合模子。

google在本年5月正式向公家先容了PaliGe妹妹a模子。google但愿PaliGe妹妹a 2可以或许成为初代模子的直接替换品。google提供了多个版本的PaliGe妹妹a 2,包括30亿、100亿及280亿参数变体,以和224像素、448像素及896像素分辩率版本。

于其他规格方面,PaliGe妹妹a 2撑持长文本字幕天生。google暗示,它将不单单局限在辨认物体,还有能辨认人物并解读其情绪。是以,假如或人感应兴奋、哀痛等情绪,PaliGe妹妹a 2都能捕获到。

此外,该模子好像还有能辨认场景中发生的更多内容,以讲述完备的故事。google称,PaliGe妹妹a于辨认曲谱、化学公式、辨认深度以和建造胸部X光片陈诉方面体现更佳。google为PaliGe妹妹a带来了相称显著的更新。假如你想利用它,可以于Hugging Face、Kaggle及Ollama平台上获取其代码。

google还有发布了其视频天生模子Veo的私有预览版。该公司于本年的googleI/O年夜会上公布了这一动静。假如你正于利用google的Vertex云平台,那末你将有时机举行尝鲜。你可以天生最高达1080p分辩率的视频。

版权所有,未经许可不患上转载

-jiuyou.com
其他新闻
识别准确率96.5%,jiuyou.com九游机器狗守护宁夏戈壁滩无人区风电站
jiuyou.com九游隧道巡检机器狗首度交付新加坡电网
全球首只“机器藏羚羊”!jiuyou.com九游科技机器狗深入可可西里腹地
社交媒体
Wechat Bilibili LinkedIn Youtube Twitter Douyin