【AI×個人情報】第3部 AIの「知ったかぶり」と個人情報。「匿名化」が最強のハルシネーション対策になる理由

【AI×個人情報】第3部 AIの「知ったかぶり」と個人情報。「匿名化」が最強のハルシネーション対策になる理由

【AI×個人情報】第3部 AIの「知ったかぶり」と個人情報。「匿名化」が最強のハルシネーション対策になる理由

前回の第2部では、「有料のBusinessプランを契約しても、個人情報や登記情報を思考停止で全部入力するのは危険」というお話をしました。

土地家屋調査士は「職務倫理規程」(日本土地家屋調査士連合会HPへ)において厳格な守秘義務が課せられており、また個人情報保護法においても、取得した情報の目的外利用は禁じられています。

(収集資料の取扱い)
第 48 条 調査士はその業務の遂行上収集した資料を成果物として依頼者に交付するものを
除き、第 45 条の規定に従って、関係法令及び個人情報の保護に関する法律を遵守し、個人
情報の保護に留意して、管理しなければならない。

引用:日本土地家屋調査士連合会HP 「土地家屋調査士職務倫理規程」より

いくらAI側が「学習しません」と契約(DPA)で約束していても、入力する側の私たちに「情報管理のモラルとルール」が求められるのは当然のことです。

では、どうすれば安全にAIを使えるのか?

結論から言います。

業務でAIを利用する際の最大の鉄則、それは「マスキング(匿名化・抽象化)」です。

依頼者の「山田太郎」さんや、隣接者の「鈴木一郎」さん、対象地の「〇〇県〇〇市〇〇町1丁目2番3」といった固有の情報を、そのままAIに入力する必要は、実は全くありません

  • 「依頼者A」
  • 「隣接地の所有者B」
  • 「甲地」「乙地」

このように、情報を抽象化して入力するのです。

これなら、万が一AIのシステムに何らかの不具合があったとしても、誰のどの土地の話をしているのか特定されることはありません。
これがシンプルかつ最強のセキュリティ対策です。

驚きの事実:「匿名化」は、AIの法的推論力を劇的に安定させる科学的アプローチ

「でも、いちいちAとかBに置き換えるのは面倒だし、AIが状況を正しく理解できないのでは?」

そう思われるかもしれません。

しかし、最先端のAI研究(自然言語処理分野)において、「固有名詞を記号(変数)に置き換えた方が、AIの推論精度や一般化能力が高まる」というメカニズムが実証されています。

これは単なるセキュリティ対策ではなく、AIから正確な法的見解を引き出すための「プロンプトエンジニアリング」の要諦なのです。

根拠1:余計な情報(ノイズ)が混ざるとAIは推論を誤る

AIから精度の高い回答を引き出す最大のコツは『余計な情報を与えないこと』です。

実際に2023年の著名な研究(Shi et al., 2023)でも、算数の文章題に無関係な1文を足しただけでAIの正答率が劇的に落ちることが実証されています。
出典:Shi, F., et al. (2023). “Large Language Models Can Be Easily Distracted by Irrelevant Context.” ICML 2023. (https://arxiv.org/abs/2302.00093

AIは人間の想像以上に『ノイズに気を取られやすい』性質を持っている点に注意が必要です。

これを土地家屋調査士の業務に当てはめてみましょう。

実務プロンプトで入力してしまう「ローカルな地名」「珍しい依頼者の実名」「関係のない親族の氏名」などは、純粋な法的判断(筆界の評価や相続関係の整理など)には直接関係がありません。

AIにとってこれらは、推論を乱す「邪魔情報」として働き、結果としてもっともらしい嘘(ハルシネーション)を引き起こす原因となるのです。

根拠2:「記号化」することで未知の事案への対応力が上がる

さらに、自然言語処理(NLP)の古典的な手法として、固有名詞を特殊なトークンに置き換える「Delexicalization(脱語彙化)」というアプローチがあります。

北陸先端科学技術大学院大学(JAIST)等の研究論文でも言及されている通り、店名・人名・地名などの固有名詞は種類が無限にあるため、そのまま入力するとAIにとって「未知の希少な単語(データ疎性)」となりやすく、処理の精度が落ちます。
出典:Tran Van Khanh (2018). “A Study on Deep Learning for Natural Language Generation in Spoken Dialogue Systems”(音声対話システムの自然言語生成のための深い学習に関する研究). 北陸先端科学技術大学院大学 博士論文. (https://dspace.jaist.ac.jp/dspace/bitstream/10119/15529/2/paper.pdf

しかし、これらを「当事者A」「物件X」といった役割(プレースホルダ)に置き換えることで、未知のデータに対する一般化能力(解析性能)が大きく改善することが報告されています。

つまり、固有名詞というノイズを排除し、「甲地を所有するAが、乙地を所有するBと〜」と純粋な記号に落とし込むことで、AIは学習データに豊富に存在する「民法や不動産登記法のルール」の適用のみに100%のリソースを注ぐことができるのです。

実務の鉄則:「法的に効く属性」は残し、「名前」だけを変数化する

ただし、むやみに情報を削れば良いというわけではありません。

匿名化のやり方を間違え、法的判断に必要な情報まで欠落させてしまっては本末転倒です。
実務でAIの精度を最大化しつつ、情報漏洩を防ぐための「変数化」の最小手順は以下の通りです。

  1. 当事者・客体を「役割」で固定する:例)山田太郎 → 「当事者A(売主)」、鈴木一郎 → 「当事者B(買主)」、〇〇町1-2-3 → 「物件P」
  2. 「法的に効く属性」は絶対に削らずに残す:例)国・都道府県(管轄)、地目、分筆登記・地籍更正登記の有無と時期、取得原因は法的判断を左右するため必ず明記する。
  3. 思考のプロセスを明確に指示する:例)「論点抽出 → 関係条文・要件の提示 → あてはめ → 不確実性(追加で必要な事実)の確認」の順で回答を出力させる。

匿名化で個人情報保護+AIの能力アップ

このように、匿名化することで下記の3点が実現可能となります。

  • 個人情報の保護(個人情報を入力しないから、万が一にもAIチャットから個人情報が流出しない)
  • AIの能力アップ(メインの出力に集中できる)
  • ハルシネーション防止(個人情報に影響されて出てくるハルシネーションを防ぎやすくなる)

第2回で解説したレッドゾーン以外の個人情報について、AIにどこまで入力するかは各事務所での判断となりますが、「まず堅く管理する」のであれば、今回ご紹介したように「当事者A(売主)」といった役割(ロール)を入れた匿名化がおすすめです。

【第1部〜第3部まとめ】土地家屋調査士のAI活用・3つの鉄則

これまで3回にわたり、土地家屋調査士がAIを安全に業務利用するためのポイントを解説してきました。

  1. 無料版は業務で使わない(学習されるリスクの排除)
  2. ChatGPT Businessプラン等を契約し、データ保護の仕組みを理解する
  3. 入力時は「マスキング(変数化)」を徹底する(セキュリティ確保と、ノイズ排除による推論精度の劇的な向上)

この3つの鉄則を守れば、情報漏洩のリスクを極限までゼロに近づけつつ、AIの恩恵を最大限に受けることができます。

↓第1部と第2部はこちら

ルール作りにお困りなら、プロにお任せください

「理論は分かったけれど、実際に事務所のスタッフ全員にこの変数化ルールを徹底させるのは難しそう…」

「論点が落ちない、実務で即使える『変数表テンプレート』を整備してほしい」

そんなお悩みを持つ土地家屋調査士の皆様のために、登記サムライドットコムでは「士業のための安全なAI導入コンサルティング」を提供しています。

個人情報保護法や職務倫理規程に完全対応したガイドラインの策定から、AIの性能を最大限に引き出すプロンプト設計まで、徹底的にサポートいたします。

まずは、貴事務所の現状と不安をお聞かせください。
AIの波に乗り遅れることなく、かつ安全な業務体制を一緒に構築しましょう。

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です

CAPTCHA