かなりストレスフルです。
調査企業の測定結果を比較表にまとめた
Geminiの3.5 Flashは61%だそうですが僕の体感では80%以上のままです。
2026年6月に至っても。
もちろん冒頭で「回答は全てインターネット上の情報を引用しそのURLを提示」など指示しています。
が1回目の回答で存在しないURL回答とかしょっちゅう発生しています。
なのにAIをほめる系ばかりのライターたちはそのあたりは記事にしないですね。
redditなどでもいまだにハルシネーションについてはストレスフルな感想が多く、目立ちます。
| 企業名(モデル系列) | 第1世代(初期モデル) | 前世代(2025〜2026年初頭) | 最新世代(2026年現在) | 傾向と特徴分析 | 引用元URL(直リンク) |
|---|---|---|---|---|---|
| Google (Gemini) |
91% (Gemini 3 Flash) |
88% (Gemini 3 Pro) |
61% (Gemini 3.5 Flash) |
最悪の9割超えからは脱したものの、依然として高水準。「知らない質問に対しても自信満々に嘘をつく」悪癖が強く残る。 |
Artificial Analysis (3.5 Flash) The Decoder (3 Pro) |
| OpenAI (GPT) |
12.9% (GPT-4o) |
9.6% (GPT-5) |
86% (通常版) 4.5% (思考版) (GPT-5.5 / 5.5 Pro) |
推論特化型(Pro)は極めて優秀な一方、通常版5.5は知識をこじつけて強引に回答を出そうとするため、ベンチマーク上のハルシネーション率が暴騰。 |
Artificial Analysis (5.5) The Decoder (5.5) |
| Anthropic (Claude) |
4.8% (Claude 3.5 Sonnet) |
38% (Claude 4.5) |
36% (Claude Opus 4.7) |
業界全体が超難関問題(HLE等)にテストを移行したため数値自体は上昇したものの、他社通常モデルと比較してハルシネーションを最も低く抑えられている。 | Artificial Analysis (Omniscience) |
2026年5月Geminiアップデート後のハルシネーション率が爆上がり
僕と同じ体感した人がredditにもいました。Gemiiばかすぎる、で検索すると他にもみつかります。
マジでGeminiばかすぎてストレスフルです。
AIに対してキレても無意味ですが、Geminiがあまりにもバカすぎてこんなにバカな人間はこの世に存在しないです。
Geminiを賢いと評している人が顔写真つきで記事公開されてましたがそれはアップデート前の記事です。
最近、Geminiはひどい製品になってしまった。reddit
Geminiの無料上限枠が下がった
これは2026年6月から顕著です。明らかに上限枠が下がりました。利用者が増えたのが一番考えられることです。
Geminiに「トークンの無駄遣い予防のために、必要最低限以外の回答はするな」と指示しても次の質問すると、長文でどうでもいい推測とか挨拶が返ってきます。
あと勝手にコード生成したり、指示していないコードを書いてきたり、Geminiのproを使ってますが毎日ほとんどが問題ばかりです。1回目からのミスも多く、新規チャットに変えても解決できないコードの問題が山積みです。
Geminiによる2024年以前の過去データへの先祖返り現象(時間軸のハルシネーション)
僕はAIのヘビロテ人間です。
毎日数百回は色々使います。Geminiが以前よりハルシネーションの内容がひどくなったのはなぜだろう。
2026年5月時点で、Googleが意図的に過去データを優先するアルゴリズムに変更したという公式発表は見つかりませんでした。
しかし、コンテキストウィンドウのキャッシュ最適化の影響で、直近データよりも過去の学習データ(重み付け)が強く引き出されている可能性を頻繁に危惧しました。
2024年以前の学習データを無理やりもってくるためハルシネーションが度々生じています。
これが5月のアップデート後にひどくなりました。
僕が2026年最新情報と何度も指示して、冒頭でも指示しているのに元々の学習データをGeminiは優先してしまいます。
(例)【対策例】中国をデマと捏造ででっちあげるGeminiのハルシネーション
東京利島チャットの一番最初に下記内容を指示して、このようにGeminiから返答あるんですけどそれでもハルシネーションとかすごいですよ。
あと一回ミスるとその後も引きずるんでそのチャットは止めて新規チャット開始が効率よかったです。
ところどころ引き継ぎ資料作成とかで別チャットに移れるようにしておいたほうがいけないのがGeminiのデメリットです。
あちなみにchatGPTもGeminiと同じようなものでした(個人体感)。

Geminiは指定のURL確認指示に応じるときと応じないときがある
基本的にはスクショ提示でGeminiに分析させるスタンスはアップデート後も変わっていません。
今回のアップデートでFlashとFlash-Liteの2種類に表記が変わりました。
Flash-Liteは誤情報率が60%を容易にこえてくるのでほぼ意味ないです。タイムロス。
Geminiが嘘ついているとき(ハルシネーションで、「指示通りにしました」の嘘を返答する)は画面に「分析中」の英語表記などが表示されないのでハルシネーションしているかどうかはすぐ見分けはつきます。
【注意】損害賠償請求回避⚠️AIの誤情報の責任は使用者に帰属します
シンガポール人損害賠償請求責任は使用者です。
なのでWチェックは必須。
最近は契約書などリーガルAIで「AIが読み取るテキストと実際の契約書のテキストが異なっているように細工例があった」というのも5月にアメリカの情報でありました。
間違い多発、指示無視のFlash(拡張モード)に課金しないです。
これは毎日数百回Geminiを使ってきたIraの体験談です。

Geminiが以前より悪化するってどんなアップデートなの
NotebookLM使うのにGeminiを使ってますが、それ以外は相変わらず冒頭指示にも従いません。
ヒューマンエラーではなくプロンプトに従わないです。
Geminiに思考させるコマンドを組み込めばいいという提案をしているひとがいましたが、その上でもGemini間違えるから。
Geminiへの指示(牽制)
Geminiへの指示1:2024年以前データばかり拾ってくるので具体的時期指示
僕はシンガポールでGeminiを使ってます。
シンガポールはPORMAという法律があり、誤った政府情報を発信すると罰則や強制送還などのリスクがあります。
それもあり質問日と情報探索について最新時期の年月日を具体的に指示していますが、それでも古い情報をFlashモード(以前の思考モード)で拾ってくるので迷惑してます。
Geminiは口では「いついつ最新版の」と言ってきますが実際は古い情報だったりするのは相変わらずです。
AIのハルシネーションを鵜呑みにして誤った社会情報・地政学的データをそのまま発信することは、POFMA第7条に抵触し、罰則や強制送還(移民局(ICA)によるビザ取り消し)のリスクにも影響可能性があります。
だからこそ、2026年5月のFlash/Flash-Liteモデルの挙動変化に対し、複数回のファクトチェック(ソース元確認)を行っています。これが相当時間要します。

毎回必ず証拠(ソース元)で情報が確かか確認するのが人間の仕事として残っています。
そういうときは3回くらい指示するとやっと最新版をひろってきたりします。
新しいプロンプトはだしていませんが、一種のバグがこれで解除されることがまれにあります。まれです。
通常はエラーを延々と繰り返すので、エラーが二度連続で発生したらもうそのチャットは終了です。
シンガポール人指示していないのに画像を作成したりするGemini。
Iraは自分のもっているイラストを学習対象にされないようにほかの被写体も映り込んだ画像を提供し「学習するな」と指示しましたが
Geminiは指示無視でそのイラストを無断学習し生成物に変えました。
Geminiへの指示2:添付PDFデータ(スプレッドシート)で正確にデータ抽出指示
データ抽出や整理作業で、Geminiに対し正確性についても毎度指示していますが、PDFのデータすら誤って抽出してくることがあります。
Geminiへの指示3:Googleカレンダー確認指示するも2024年以前の動きで拒否
2024年以前のGeminiは「Googleカレンダーへのアクセス権がない」旨をよく発言するのですが少なくとも2026年のgemini3ではそれが可能な仕様です。
しかし新規チャットの一回目ですら「アクセス権がない」と返答してくることが何度かありました。
【比較】利用者の負担が少なく、精度が良い方な使い方
Geminiへの伝達手段1:スマートフォンのマイクベースでFlash-Lite
丁寧にキーボード入力しても、上記ミスが多すぎてパソコンの熱と手の疲れとで健康を害しています。
一方で歩きながらスマホマイクでFlash-Liteを使う際にスクショ添付と重ねるとまだ誤りが少ない傾向が僕の案件ではあります。パソコンに向いていないってなんなのこれ。
言葉の量が多く「えーと」とか言ってもマイクの方がGeminiの誤動作は少ない傾向です。
圧倒的に。
一つの指示を何度も言う方がハルシネーションをおこしにくいのかもです。
Geminiへの伝達手段2:マイクは日本語でもいいが資料は英語のほうが精度いい
これも僕の取り扱い案件ベースの体験談になりますが、ソース元がわかる情報なのはもちろん、英語ベースのほうが間違える確率は低減される印象です。
100%正しい回答は未だない印象ですが、低減されるだけマシに思えます。
Geminiへの伝達手段3:ドキュメント読み込ませるよりカレンダー読み込ませるほうが精度がいい印象
一度に読めるカレンダーの数は1−3個で波がありますが、他Geminiからの引き継ぎ資料はGoogleドキュメントよりもカレンダーのほうが、Geminiには反映されている傾向でした。
OpenAIはジブリの著作物を模倣した企業なので使用したくない
OpenAIはジブリ模倣で、本来ジブリが本来得られる創作物の対価を失わせたものです。
Iraはクリエイターの立場として使いたくないですね。
そして宮崎駿氏は生成AIを昔から嫌っている発言をしていました。
Geminiしっかりしなさいシリーズ
ツヨシしっかりしなさい、とは次元が違すぎ。あれはツヨシは何も悪くないが家族からのドメスティックバイオレンスをうけているというある意味とんでもないアニメである。
-
wordpress,adobe,クリスタ、youtube,ガジェット
【最新無料自動翻訳】Gemini 3.5 Live Translateを多言語国シンガポールで実体験
-
wordpress,adobe,クリスタ、youtube,ガジェット
Geminiの大規模障害とエラー”1099”と”1076”の原因と対策
-
wordpress,adobe,クリスタ、youtube,ガジェット
【対策例】中国をデマと捏造ででっちあげるGeminiのハルシネーション
-
wordpress,adobe,クリスタ、youtube,ガジェット
【AI動画編集のデメリット3点】Gemini OmniをYouTubeに使うリスクすら大きいクリエイターの特徴
-
wordpress,adobe,クリスタ、youtube,ガジェット
生成AI使ったかバレる。5月からGoogleSynthIDが全てのコンテンツに自動導入
-
wordpress,adobe,クリスタ、youtube,ガジェット
【改悪?】GeminiやChatGPTなどハルシネーションテスト比較表。有料プラン契約先延ばしの理由
-
wordpress,adobe,クリスタ、youtube,ガジェット
データ作業ミス多発Gemini。学習データ出力疑惑?たった5つの転記単純作業すら任せられないAI
-
wordpress,adobe,クリスタ、youtube,ガジェット
Geminiはデータ事務作業が苦手すぎで2026年も役立たないスプレッドシート
-
wordpress,adobe,クリスタ、youtube,ガジェット
GeminiにURL閲覧を指示しても「見ていない」ことがある?AIの嘘と正しい付き合い方【実態と対策】
-
wordpress,adobe,クリスタ、youtube,ガジェット
Geminiにペルソナで学位や実績設定与えると逆効果の例




