每日快讯!比OpenAI更快一步，最新开源的MiniGPT-4模型可让开发者提前感受GPT-4识图能力！

当前位置：首页 > 资讯 > >正文

每日快讯!比OpenAI更快一步，最新开源的MiniGPT-4模型可让开发者提前感受GPT-4识图能力！

来源：CSDN公众号时间：2023-04-19 19:47:52

声明：本文来自于微信公众号 CSDN（ID:CSDNnews）），整理 |屠敏，授权站长之家转载发布。

迄今为止，GPT-4凭借多模态能力已经成为 AI 领域备受关注的大模型，不过值得注意的是，OpenAI在推出 GPT-4时虽然引入了对图像理解的能力，但并没有在除了 Be myEyes（针对盲人或弱视人士的应用程序和服务）应用程序之外的任何地方提供此功能。

【资料图】

GPT-4对图像理解能力的示例详见:

用户:这幅画有什么好笑的地方?逐一描述它的板块。

图片来源:https://www.reddit.com/r/hmmm/comments/ubab5v/hmmm/

GPT-4:图片显示的是一个 "Lightning Cable "适配器的包装，有三个板块:

板块1:一部智能手机，VGA 连接器（通常用于电脑显示器的大型蓝色15针连接器）插在其充电端口。

板块2:"Lightning Cable "适配器的包装上有一张 VGA 接口的图片。

板块3:VGA 连接器的特写，末端是一个小的 Lightning 连接器（用于为 iPhone 和其他苹果设备充电）。

这张图片的幽默感来自于将一个大的、过时的 VGA 连接器插入一个小的、现代的智能手机充电端口的荒谬性。

近日，来自沙特阿拉伯阿卜杜拉国王科技大学的研究团队推出了一款名为 MiniGPT-4的新模型，以开源的形式提供了此功能。

研究人员还透露，MiniGPT-4具有许多类似于 GPT-4所展示的功能，下文我们也将分享相关的实例。

可执行复杂的视觉语言任务的 MiniGPT-4

该团队发现尽管 GPT-4表现出非凡的能力，但是其特殊能力背后的方法并不为众人所熟知。因此，他们提出「GPT-4具有先进的多模态生成能力的主要原因在于利用了更先进的大型语言模型（LLM）」这一想法。

为了验证这一想法，他们便提出了 MiniGPT-4模型。

根据研究团队发布的论文显示，为了构建 MiniGPT-4，研究人员使用了基于 LLaMA 构建的 Vicuna 作为语言解码器，并使用 BLIP-2视觉语言模型作为视觉解码器。

其中，Vicuna 和 BLIP-2都是开源的。这意味使用开源软件可以用较少钱进行训练和微调，并且没有海量数据和开销，这也是为什么这个模型加上了“mini”的前缀。

在实验中，该团队发现只对原始图像-文本对进行预训练会产生不自然的语言输出，包括重复和零散的句子，缺乏连贯性。为了解决这个问题，其在第二阶段策划了一个高质量、一致性好的数据集，利用对话模板对此模型进行微调，这一步被证明对提高模型的生成可靠性和整体可用性至关重要。

具体来看，研究团队分两个阶段训练了MiniGPT-4模型。

第一阶段，研究团队首先在四张 NVIDIA A100显卡上利用了大约500万个对齐的图像-文本对，让 MiniGPT-4进行了十个小时的训练。在第一阶段之后，Vicuna 能够理解图像。但是 Vicuna 的生成能力受到了很大的影响。

为了解决这个问题并提高可用性，研究人员提出了一种通过模型本身和 ChatGPT 一起创建高质量图像文本对的新方法。因此，展开了第二阶段的微调训练，该模型使用 MiniGPT-4和 ChatGPT 之间的交互生成的3，500个高质量文本图像对进行了改进。ChatGPT 更正了 MiniGPT-4生成的不正确或不准确的图像描述。

这一步显著提高了模型的可靠性和可用性，MiniGPT-4能够连贯地和用户友好地谈论图像，并且只需要在单个 NVIDIA A100上进行七分钟的训练。让研究人员自己都感到惊讶的是，这个阶段的计算效率很高。

MiniGPT-4架构

MiniGPT-4Vicuna 的语言模型遵循 "Alpaca 公式"，使用 ChatGPT 的输出来微调 LLaMA 系列的 Meta 语言模型。据说 Vicuna 与 Google Bard 和 ChatGPT 相当，同样只需相对较小的训练工作量。

当前，该研究团队已经将 MiniGPT-4的代码、预训练的模型和收集的数据集在 GitHub 上开源:https://minigpt-4.github.io/。

拥有和 GPT-4相似的图片解析功能

正如开头所述，该研究团队推出的 MiniGPT-4拥有和 GPT-4相似的功能。譬如:

给它一张图，便能生成详细的图像描述:

也能讲出图片中搞笑、有趣的部分:「星期一通常被认为是一周中最令人恐惧的一天」。

还能在进一步交互中发现不寻常的内容，如:虽然仙人掌有可能在寒冷的气候条件下生长，但很少看到仙人掌生长站在冰冻的湖泊中间。此外，水面上形成的大冰晶也不是常见的现象。

于是，MiniGPT-4给出了自己的见解:这张图片很可能是数字创作或操控的。

当然，和 GPT-4演示的一样，MiniGPT-4也能根据手绘草图生成网站:

识别图像中的问题并提供解决方案:

以及创造诗歌或说唱歌曲的灵感:

此外，也能根据图片续写故事，给产品做广告，对图像展现的画面进行评论、检索与图片有关的事实，以及当给定一张准备好的菜肴照片时，该模型可以输出（可能）与之匹配的食谱或者生成一个适合视障人士的图像描述。

开源类 GPT-4模型层出不穷

鉴于 OpenAI 没有透露太多关于 GPT-4架构（包括模型大小）、硬件、训练计算、数据集构建、训练方法的细节，强大的 LLM 的开源 MiniGPT-4可能在研究方面具有重要意义。

对于 MiniGPT-4的到来，也引发了一些 HN 网友的热议，有网友表示:

在技术层面上，这个研究团队正在做一些非常简单的事情--将 BLIP2的 ViT-L+Q-former，用一个线性层连接到 Vicuna-13B，并在一些图像-文本对的数据集上只训练这个小层。

但结果是相当惊人的。它完全打败了 Openflamingo 和甚至原始的 blip2模型。最重要的是，它比 OpenAl 的 GPT-4图像模态更早到达。（这是）开源人工智能的真正胜利。

也有媒体评价到，「MiniGPT-4是开源社区在很短时间内取得快速成功的另一个案例。前几天，开源聊天机器人 OpenAssistant推出，使用从志愿者那里收集的指导数据进行训练，并打算最终成为一个 ChatGPT 的开源平替。这表明纯AI 模型公司的护城河可能没有那么高。在这种趋势下，对于 OpenAI 公司而言，首先应该专注于使用 ChatGPT 插件为 GPT-4建立一个合作伙伴生态系统，而不是现在就训练 GPT-5，这是有意义的。」

事实上，除了OpenAssistant、MiniGPT-4之外，GitHub 上也有网友盘点了近段时间来诞生的许多开源模型（https://github.com/nichtdax/awesome-totally-open-chatgpt），如Databricks 推出的 Dolly 模型、类 ChatGPT 的PaLM-rlhf-pytorch、OpenChatKit 等等，为此，你认为开源大模型在此趋势下会迎来什么样的发展机遇?欢迎留言分享你的看法。

关于 MiniGPT-4模型的更多内容可参考:

项目地址:https://minigpt-4.github.io/

GitHub地址:https://github.com/Vision-CAIR/MiniGPT-4

论文地址:https://github.com/Vision-CAIR/MiniGPT-4/blob/main/MiniGPT_4.pdf

参考:

https://the-decoder.com/minigpt-4-is-another-example-of-open-source-ai-on-the-rise/

（举报）

X 关闭

最近更新

每日快讯!比OpenAI更快一步，最新开源的MiniGPT-4模型可让开发者提前感受GPT-4识图能力！

2023-04-19 19:47:52

资讯
环球滚动:血压太低吃什么食物补_血压太低吃什么

2023-04-19 19:00:18

资讯
没去过这两处却收到交通违规短信-当前要闻

2023-04-19 18:41:56

资讯
谷歌 MusicLM 模型可根据文本生成 5 分钟歌曲

2023-04-19 18:51:22

资讯
蝴蝶和蛾子的区别焦点精选

2023-04-19 18:29:46

资讯
我在珠晖拍春天丨是心动啊在金甲玫瑰园与浪漫撞个满怀

2023-04-19 17:49:55

资讯
今头条！北京长峰医院院长王某玲等12人被刑拘

2023-04-19 17:42:57

资讯
浩瀚深度: 北京浩瀚深度信息技术股份有限公司关于2023年度董事、监事和高级管理人员薪酬方案的公告_环球今日讯

2023-04-19 17:33:00

资讯
微信酒托女聊天技巧酒托女经典聊天记录

2023-04-19 17:02:36

资讯
怡合达(301029.SZ)：定增申请获深交所受理

2023-04-19 16:52:36

资讯
安徽省人大常委会监察和司法工作委员会原副主任高宗祥接受审查调查

2023-04-19 16:46:06

资讯
炫酷！秦创原·金湾科创区“三项改革”清控服务展厅“硬科技”满满-焦点简讯

2023-04-19 15:54:47

资讯
贸易、投资、基建：中国“三驾马车”带动拉美就业

2023-04-19 15:20:16

资讯
2023年云南摸你黑节什么时候举行？在哪里举行？

2023-04-19 15:23:42

资讯
全球动态:川财证券研究所晨报

2023-04-19 15:17:28

资讯
市七中着力打造学生“爱校传奇” 世界热文

2023-04-19 14:22:52

资讯
味多美、小谷姐姐麻辣烫、小乐多等因食安问题被通报_天天观热点

2023-04-19 14:17:45

资讯
焦点日报：数字春风掀起宁夏“绿色消费”新热潮 2023数字生活节启动

2023-04-19 13:37:34

资讯
谁是最常用的银行APP？全球微动态

2023-04-19 13:23:11

资讯
世界热点评！机构追高抢筹传媒股，慈文传媒3天2板，还能上车吗？果然一字跌停！这些公司业绩“地雷”集中爆发

2023-04-19 13:01:25

资讯
快资讯丨《黑暗荣耀》主角群变柯南画风！网友超高还原度逗乐剧

2023-04-19 12:53:02

资讯
咽喉有异物怎么处理_咽喉有异物怎么弄出来-天天速读

2023-04-19 12:00:37

资讯
神马股份董秘回复：公司可转债将于4月20日上市交易

2023-04-19 11:54:38

资讯
京东集团助力贵州天柱县乡村振兴项目发布会即将举行

2023-04-19 11:17:05

资讯
财政局：聚焦“产业+创新+人才”政策引领为经济复苏注入“强心剂”

2023-04-19 11:18:16

资讯
电影《检察风云》预售开启黄景瑜白百何极限博弈掀舆论之战

2023-04-19 11:01:56

资讯
从洞察需求中深挖生产经营潜力|环球观速讯

2023-04-19 10:19:26

资讯
奇安二期网安基金完成最终关闭|环球最新

2023-04-19 10:12:26

资讯
全球新消息丨让老年人活得更有质量我市启动老年健康教育与促进行动

2023-04-19 09:53:46

资讯
南宁：加快建设面向东盟开放合作的国际化大都市环球即时

2023-04-19 09:46:17

资讯
中小银行存款利率集体“补降”，未来或进一步下行

2023-04-19 09:19:21

资讯
国家统计局：全国企业就业人员周平均工作时间48.7小时

2023-04-19 08:53:27

资讯
浙江金华一厂房火灾事故造成11人遇难聚看点

2023-04-19 08:23:25

资讯
“寿有三不过，后代福气多”，三不过具体指什么？-环球热推荐

2023-04-19 08:11:01

资讯
“微出汗”系列报道 | 学会看空气质量再健身，这样运动危害大，老友们三思而后行-焦点热议

2023-04-19 08:03:44

资讯
你真的要和一头熊生活在一起吗?你不就是吗?|世界百事通

2023-04-19 07:16:53

资讯
世界通讯！九阳破壁机可以打杂粒磨粉吗?

2023-04-19 07:06:28

资讯
问道手游天外之谜多宝道人视频_问道手游天外之谜多宝道人焦点热议

2023-04-19 06:52:15

资讯
这是一架“有味道”的航班全省首批菲律宾进口榴莲打“飞的”来了

2023-04-19 06:23:43

资讯
午餐教你几道家常菜，看着就有食欲，美味诱人，请客吃饭有面子|环球热推荐

2023-04-19 05:51:27

资讯
南江之家——贵阳市民休闲度假又多了一个好去处

2023-04-19 05:25:48

资讯
全球快消息！注意！延华智能将于5月12日召开股东大会

2023-04-19 04:58:57

资讯
狂抢23个篮板破队史纪录辽宁争冠没他真的不行

2023-04-19 04:30:07

资讯
天天速递！魅惑帝国首领书籍_魅惑帝国首领

2023-04-19 04:13:11

资讯
天天视讯！2023苏州育儿假最新规定（附文件）

2023-04-19 03:39:52

资讯
灵与肉舒淇电影播放灵与肉舒淇

2023-04-19 03:08:54

资讯
【热闻】古魂手游通行证赛季任务完成技巧一览

2023-04-19 02:47:53

资讯
新乡订餐平台_新乡团购网

2023-04-19 02:33:51

资讯
世界资讯：嫁日喜洋洋

2023-04-19 01:58:38

资讯
赌王千金大婚，何家人“低调”集体缺席-时讯

2023-04-19 01:31:10

资讯
天天动态:理想勾晓菲：智能座舱远未成熟，尚处初级阶段

2023-04-19 01:15:49

资讯
曹和平真实身份_曹和平律师_世界新要闻

2023-04-19 00:43:51

资讯
财报速递：祥生医疗2022年全年净利润1.06亿元，总体财务状况一般天天时快讯

2023-04-19 00:19:51

资讯
宁德时代获深股通连续4日净买入累计净买入17.25亿元

2023-04-19 00:12:45

资讯
一季度中国财政收入呈回稳向上态势_焦点热闻

2023-04-18 23:35:54

资讯
上世纪建的潼泾新村焕然一新全球短讯

2023-04-18 23:16:37

资讯
环球今日讯！不想别人否定，自己就要更加努力！双色球23043期晒票：仅供参考

2023-04-18 22:58:49

资讯
三名男子以假乱真实施诈骗，三天内诈骗金额近7万元

2023-04-18 22:13:46

资讯
泰安市岱岳区道朗镇：春茶采摘正当时_天天快播报

2023-04-18 22:09:53

资讯
环球消息！陈幸同1-3遭逆转止步首轮！王曼昱连赢3局过关，直言要专注每一分

2023-04-18 21:32:49

资讯
国际乒联公布最新世界排名樊振东、孙颖莎继续位居男、女单榜首世界报道

2023-04-18 21:23:17

资讯
欧洲议会支持欧盟碳市场改革，航运业明年或将被纳入碳市场_今日播报

2023-04-18 21:03:56

资讯
热文：英超官方：迈克尔-奥利弗执法联赛第33轮曼城vs阿森纳

2023-04-18 20:43:51

资讯
玉溪江川之战——云南消防史上最大规模会战_天天速看料

2023-04-18 19:37:37

资讯
今亮点！小米米家手持蒸汽熨烫机上架：279元

2023-04-18 19:01:48

资讯
【世界聚看点】舒城职业学校赴霍山职业学校考察交流

2023-04-18 19:04:15

资讯
信邦制药(002390)3月31日股东户数8.22万户，较上期减少1.43%

2023-04-18 18:28:25

资讯
photoshopadobe image_imageready在ps哪里

2023-04-18 17:56:08

资讯
NBA球队海外社媒粉丝榜出炉！湖人强势居首，勇士次席，火箭第五

2023-04-18 17:52:16

资讯
沙县区气象台发布雷电黄色预警【Ⅲ级/较重】热门看点

2023-04-18 17:35:48

资讯
湖北郧西：借“高铁”拉动优势引资超百亿元_今日热搜

2023-04-18 17:00:52

资讯
精选！纽约华埠“桥头夜市”6月2日登场展示华裔文化

2023-04-18 16:37:20

资讯
7个月婴儿便秘怎么办什么方法最有效婴儿便秘怎么办什么方法最有效|焦点信息

2023-04-18 16:14:51

资讯
世界观点：小学生歌颂祖国诗歌诵读串联词_小学生歌颂祖国诗歌

2023-04-18 15:56:35

资讯
广汽集团总经理冯兴亚：今年车市竞争比想象中激烈，增速比想象中慢

2023-04-18 15:48:17

资讯
为合作伙伴造土壤大润发发起“生鲜4S计划”-环球关注

2023-04-18 15:18:43

资讯
2023年住房公积金利息是多少钱？

2023-04-18 15:06:11

资讯
2022年苹果12估计降到多少？

2023-04-18 14:26:06

资讯
今日卢布对欧元汇率（2023年4月17日）

2023-04-18 13:49:52

资讯
国家统计局：下阶段要着力扩大国内需求培育壮大新兴产业 _环球看点

2023-04-18 11:32:59

资讯
如何减少钠的摄入-每日观察

2023-04-18 10:59:56

资讯
巧思+巧手，七旬老人让易拉罐变身艺术画当前视点

2023-04-18 10:27:12

资讯
南京灵活就业人员社保2023年缴费价格表、标准如下

2023-04-18 09:36:22

资讯
西藏今年一季度接待海内外游客255.74万人次环球观点

2023-04-18 08:56:01

资讯
卫星数字融合短视频讲述首都发展|天天观焦点

2023-04-18 07:30:56

资讯
柿子的作用与功效_柿子有什么作用

2023-04-18 06:01:20

资讯
男子110米栏世界纪录排名_男子110米栏世界纪录-世界时讯

2023-04-18 01:58:34

资讯
安全宣传进基层-世界动态

2023-04-17 22:28:51

资讯
化学专业就业前景分析化学专业就业前景|全球看热讯

2023-04-17 21:02:18

资讯
600136(诺奇股份)

2023-04-17 19:35:49

资讯
福建开通首条“福州—厦门”海峡快线

2023-04-17 18:35:50

资讯
外媒：日本世嘉将收购《愤怒的小鸟》开发商芬兰罗维奥公司当前观察

2023-04-17 17:46:51

资讯
全球热议:怎么关闭skype开机自动启动_skype关闭开机启动

2023-04-17 16:47:54

资讯
全球动态:本周国内尿素价格上涨0.61%（4.10-4.16）

2023-04-17 15:52:07

资讯
环球观速讯丨351证居民告别厨卫合用！这个大体量旧住房成套综合改造项目高比例生效

2023-04-17 15:22:45

资讯
焦点短讯！什么是三防平板电脑，“三防”是指哪三种防护？

2023-04-17 14:05:46

资讯
泰州姜堰：“三榜一墙”亮榜晒绩建强公安队伍增活力世界观焦点

2023-04-17 13:01:00

资讯
天天播报:《昆明市生活垃圾管理条例》6月1日起施行

2023-04-17 11:48:53

资讯
关注丨年内首场货币政策例会有些新变化世界关注

2023-04-17 11:22:09

资讯
每日热闻!重塑“易碎”人生

2023-04-17 10:19:58

资讯

每日快讯!比OpenAI更快一步，最新开源的MiniGPT-4模型可让开发者提前感受GPT-4识图能力！

推荐内容

最近更新