【本ページはプロモーションが含まれています】

ChatGPT

GPT-4Vのプロンプトテクニックなどを徹底解説!166ページの論文を読んでまとめてみた

#chatgpt

チャンネル:にゃんたのAI実践チャンネル【Python × 機械学習 × ChatGPT】

#ai #python #プログラミング #gpt-4v #chatgpt

こんにちは、にゃんたです。
今回はGPT4Vについてまとめてみました。
マイクロソフトが出している166ページの論文を読んでみて
面白そうな点や、プロンプトのテクニックなどをまとめています。
GPT4Vすごいです・・・!

00:00 オープニング
01:38 テキストにも強い
02:52 複数の画像の組み合わせができる
04:05 画像に書いた情報を理解できる
06:27 汎用性がとにかく高い
07:02 Dense captioning
08:35 表も読み取れる
09:11 間取りも読み取れる
09:40 PDFを画像として読み込む
10:30 画像も多言語対応
10:56 文化やジョークも理解できる
11:34 美的価値も理解できる
13:19 プロンプトテクニック
13:47 1.Constrained prompting
14:52 2.Condition on good performance
17:58 3.Visual Referring prompting
19:47 4.In-Cintext Learning
22:05 未来の可能性
27:21 エンディング

■論文のリンク
The Dawn of LMMs: Preliminary Explorations with GPT-4V(ision)
https://arxiv.org/abs/2309.17421

■以前の関連動画
ChatGPTのプロンプトの作り方を徹底解説!望む回答を得るためのテクニックとコツ

■Udemy
ChatGPTAPIの使い方講座も作成しているので興味があれば是非!(クーポン発行してます!)
https://linktr.ee/nyanta_youtuber

■Twitter

■言語モデル関連のおすすめ書籍


・大規模言語モデルは新たな知能か――ChatGPTが変えた世界
https://amzn.to/3YhtYCk

※上記製品リンクURLはAmazonアソシエイトのリンクを使用しています。
------------------------------------------------------------------------------------------------------
■楽曲提供
フリーBGM DOVA-SYNDROME : http://dova-s.jp/
効果音ラボ : https://soundeffect-lab.info/

■編集
にゃんた妻
 一言:編集、過去一の大変さでした😆
------------------------------------------------------------------------------------------------------

#youtube #chatgpt #aiイラスト

-ChatGPT

Vtuberを探せるサイト
Translate »