AIを使い始めてみる(2023年4月)

≪≪この記事をすべて読むには約 20 分かかります≫≫

Stable DiffusionやChat GPTが大々的にクローズアップされてからかなり経ちました。遅ればせながら色々と試し始めました。

Chat GPTを試してみる

Chat GPTは、このところ聞かない日はないくらい(一部で)話題になっている、FacebookのMetaやMicrosoftなどと連携してサービスを展開しているOpen AIの自然言語対話プログラムです。

Chat GPTに書き出しの文章を入れて出力させてみました。

「AI使用サービスを使い始めた話」でブログ記事を書きたい。以下の書き出しから始めて、続きを作成するためのアウトラインを作成して。「Stable DiffusionやChat GPTが大々的にクローズアップされてからかなり経ちました。遅ればせながら色々と試し始めました。」

すると、以下のように出力されてきます。かなりいい感じで書けそうな予感がします。

タイトル:「AI使用サービスに遅ればせながら挑戦してみた」

  1. AI使用サービスの説明
    • AIを活用したサービスの種類や例
    • AIがもたらすメリットについて
  2. AI使用サービスを始めるまでの経緯
    • AI技術に対する不安や不信感
    • 導入に必要な知識やリソースの不足
    • 時間やコストの問題
  3. AI使用サービスの導入と試用
    • 選んだサービスとその理由
    • 実際の導入過程や試用の感想
    • 利用する上での課題や不満点
  4. AI使用サービスを活用した結果
    • 実際にAI使用サービスを活用することで得られたメリット
    • 実績や成果の共有
  5. 遅ればせながら挑戦して良かったこと
    • AI使用サービスの導入を遅らせたことの問題点
    • AI使用サービスの活用によって得られたメリットについて
  6. 今後の展望
    • AI使用サービスの活用によって得られた成果を今後どう活かすか
    • 他のAI使用サービスの導入についての検討
  7. 結論
    • AI使用サービスを導入することの重要性について
    • AI使用サービスの導入を遅らせないためのアドバイス

「それぞれの項目について、詳細な内容をブログ記事用に書いて」、とお願いして、途中で切れたので「続きを書いて」と指令した結果をそのまま載せてみます。

AI使用サービスに遅ればせながら挑戦してみた

1. AI使用サービスの説明

AI(人工知能)を活用したサービスは、近年注目を集めています。AI使用サービスの種類には以下のようなものがあります。

  • 自然言語処理:言語の解析や翻訳などを行う技術
  • 画像認識:画像の解析や判別などを行う技術
  • ロボティクス:ロボットの動作や制御などを行う技術
  • データ解析:ビッグデータを解析して、予測や分析を行う技術

AI使用サービスを活用することで、従来の人間の作業では難しかったタスクや、短時間で大量のデータを処理することができるようになります。また、AIによって自動化された作業によって、作業効率が改善されるなどのメリットもあります。

2. AI使用サービスを始めるまでの経緯

AI使用サービスを導入するまでには、いくつかの課題があります。私がAI使用サービスに遅ればせながら挑戦するまでに抱いていた課題は以下のようなものでした。

AI技術に対する不安や不信感

AI技術が新しいため、不安や不信感を抱いている人も多いかもしれません。AI技術は専門知識が必要であったり、実装には多くのリソースが必要だったりするため、一般の人々には理解しにくい技術であると感じられることがあります。

導入に必要な知識やリソースの不足

AI使用サービスを導入するには、実装や運用に必要な知識やリソースが必要です。自社内で専門知識を持っている人材がいない場合は、外部の専門家や企業との協力が必要となります。また、導入するシステムによっては、高度なコンピュータリソースが必要となる場合もあります。

時間やコストの問題

AI使用サービスを導入するには、時間やコストがかかる場合があります。実際の導入にあたっては、プロジェ…

3.実際にAI使用サービスを始めた経緯

私がAI使用サービスを始めるにあたっては、まずは自社の業務における課題を洗い出し、その課題を解決するためにAI使用サービスを活用することができるかどうかを検討しました。その結果、顧客からの問い合わせ対応が課題として挙げられ、自然言語処理を活用したチャットボットの導入を検討することになりました。

具体的には、Chat GPTという自然言語処理の技術を活用したチャットボットを導入することになりました。Chat GPTは、OpenAIが開発したAIモデルで、自然言語の処理や生成において高い精度を誇ります。また、Chat GPTは、事前学習済みのモデルを提供しているため、実装が比較的容易であり、自社のニーズに合わせたカスタマイズが可能であることが選定理由の一つでした。

導入にあたっては、Chat GPTを活用したチャットボットの実装や運用に必要なリソースや知識を自社で確保することができなかったため、AI導入支援サービスを提供する企業との協力によって導入することとなりました。

4.導入後の効果や課題

導入後の効果としては、顧客からの問い合わせに対する対応時間の短縮や、24時間対応が可能になったことが挙げられます。また、チャットボットによって、顧客の問い合わせに対する回答精度が向上したことも効果の一つです。

一方で、導入にあたっては、実装や運用に必要なコストが予想以上にかかってしまったことや、顧客からの問い合わせ内容によってはチャットボットの回答が不適切だったことが課題として挙げられました。これらの課題に対しては、運用を改善するための取り組みを進めています。

5.AI使用サービスを導入する際のポイント

AI使用サービスを導入する際には、以下のようなポイントを考慮することが重要です。

  • 課題の明…

Chat GPT、使い方次第ではいいかも

上に書いたような結果が得られました。よく言われるように、AIサービスを利用するだけで、何となくそれらしい文章は出来上がります。

そのままだと自分の意見ではなく、「自分が書きたかった」内容ではないものが出来上がってしまっています。アウトライン作成時点や、もしくは中身を書いてもらう時点で指示を出せば、自分の思い通りの文章に近づけると思います。

これは、使っていくと段々とできるようになっていく類のものだと思います。昔を思い出してみると、Yahoo検索ですべてを賄った時代や、Google検索を使い始めたころ、検索ワードが上手く設定できなくて欲しい答えが得られなかったことがありました。今でも、場合によってはうまく目的の内容が探し出せないこともあると思います。かつてと同じで、使っていくうちに使い方を段々と覚えていくのだと思います。そのためには、まず、使ってみることが重要ですね。

色々なサービスを無料枠でとりあえず使ってみる

無料で使えるものがたくさんあるので、取り合えずすでに例を出したChat GPT以外にもいろいろなモノを触ってみます。

文章生成系

文章生成系はかなり発達していて、日本語の生成がかなり自然です。いくつか試した結果、現時点(2023年4月中旬)ではBing Chat、Perplexity、Vicunaを使っていこうと思います。

ChatGPT

ChatGPTは、ブームの火付け役の一つでOpen AIのGPT-3.5ベースです。GPT-3.5より学習効果を上げて高性能にしたGPT-4を使用するChatGPT Plusというサービスも並行して利用可能ですが、有料プランなのでとりあえずパスします。

Bing Chat

Microsoftのブラウザ、Bingに付随するようになったBing ChatもしくはBing Copilotです。ChatGPT Plusと同じGPT-4がベースで、検索して調べて回答してくれるので結構便利に使えそうです。

ただ、かなり変な回答をくれることもあり、ハルシネーション(幻覚)と言われるらしいですが、すごく気を付けないと完全な誤りに基づいた知識になっている可能性もあるので注意が必要です。

Perplexity AI

ChatGPTと異なり、「検索」して結果をリストアップしてくれるところがよいAIサービスです。Bing Chatと異なり書いた内容の出典を明示してくれるので、解釈間違いなどに気づくことができるので調べものに適したAIです。

Rytr

文書作成に特化したサービスで、有料プランの一部だけ無料で試用できる感じです。結構前からあるようで、GPT-3ベースです。

登録して使ってみましたが、他のサービスよりも世代が古いGPT-3のためか、出てくる文章があまり役立ちそうにありませんでした。

Notion AI

メモを中心とした文書整理アプリのNotionにAIで文章などを作成させることができる追加サービスです。よくRytrと比較されていますが、単純な文章ではない表などを作ってくれるらしく、便利は便利だと思いますが、Rytrと同じくGPT-3ベースらしいです。

GPT-3ベースのサービスはちょっと出てくる文章が特に日本語だとちょっと役立ちそうにありません。

Vicuna

モデルをダウンロードして、自分のコンピュータで使える対話型AIです。GPT-4より少し足りないくらいのGPT-3.5+独自学習モデルがベースになっているらしいです。

簡単で、使用制限がなく、現時点で一番使いやすい気がします。検索を絡める必要があれば、Bing ChatかPerplexityかなーと思います。

AI One

日本国内の会社がChat GPT PlusとStable Diffusionを再販しているらしいサービスです。

登録してみましたが無料枠が小さいので、米ドルでの支払いがちょっと無理!、とか日本の会社が入っていて日本語サポートがないと嫌!という人にはリーチするのかもしれません。

翻訳・外国語系

DeepL翻訳

Google翻訳やBing翻訳よりも精度が高い、らしいです。まだ使い込んでいないので何とも言えませんが、評価は高い感じです。スマホアプリ、Windowsアプリもあるので、使いこなせるとかなりいい感じになりそうです。

DeepL Writer(未使用)

DeepLで添削をしてくれるサービスです。使ってみたいです。

Ginger(昔使ってた)

2010年代前半くらいだったか、Grammarlyと併せて契約して使っていた気がします。少し癖が違って得意、不得意があったような気がします。

細かい間違いなどを直してくれるので助かった覚えがあります。以前からアップグレードしているのでしょうか?

Grammarly(昔使ってた)

画像生成系

私は絵心がないので、画像生成系のAIは非常に助かります。クリエイターから批判的な意見が多いのはわかりますが、絵を描く才能がない私のような人間にはとても魅力的です。ただ、絵心がない私が使ってもなかなか良い絵は出てこないのが現実ではあります。

画像生成系のAIは、既存の、誰かが作ったイラスト・写真を学習させた結果を利用しています。そのため、オリジナリティが低くなりがちです。また、学習に使用したデータ自体の使用権があったのか、使用するのに問題ないのか、使用した結果出来上がったモデルの生成物の著作権は・・などなどの問題もあります。

たた、問題視されるのもわかりますが、AIが進出してくる分野は画像生成だけではありません。文章のライティング・校正、情報収集も、プログラマーも、単純な事務仕事も、きっと私や読者のあなたの本業も、ほとんどの分野でAIがもう少し改良されていくと、一部のトップランナーを除いた「その他大勢」の人は要らなくなる可能性があると考えられています。本当に一部の仕事、介護・育児はAIの参入が難しいと言われていますが、他はなくなる可能性があります。

イラストレイターに限った話ではないですよね。

Leonardo.aiで勉強しつつStable Diffusionをメインで使い、ちょっとしたことにはBing Image Creatorで行こうかなと思います。

Stable Diffusion

2022年に非常に話題になり、出力画像を見たときに衝撃的だった覚えがあります。自分で公開サイトで試してみましたが、時間がかかるのと込み合っていて受付中止、みたいな感じであまりできませんでした。とりあえず少しだけやって、ローカルで動かすためのマシンを購入して、しばらく放置していましたが、すでに当時よりもずいぶん進んでいる感じがします。

画像生成の学習済みモデルが多数出ており、基本的には「safetensor」のものを使うのが良く、細かい調整が入った画像を作りたい場合は、「LoRA」(Low-Rank Adaptation)モデルという、追加で少量の対象を学習させて新しくニュアンスの違う出力を得るものを使うこともできます。

作例とともに、たくさんのモデルがダウンロードできるサイトがあります。

Stable Diffusion XL(未使用)

Stable Diffusionに新しいバージョンが出たようです。開発元のStabilityAIのクラウドサービス、DreamStudioの有料版ユーザーはベータ版として利用できるようで、そのうち、オープンソースに移って無償公開されるらしいです。

使ってみたいですね。

Leonardo.ai

高機能なベータ版サービスです。現時点では作成された画像が基本的に公開されて共有されていくサービスになっているようです。

マスキングして書き直しとか、ずらして再描画、追記、その他色々調整も効くらしく、とてもよさげです。

作例がプロンプト・ネガティブプロンプトとともに公開されているので、プロンプトをヒトが学習するのに良いという評判です。これで勉強してみたいと思います。(モデルダウンロードのcivitaiでも見られます。)

Midjourney(未使用)

Discord上で動作するらしい、Stable Diffusionと同じくらい有名なサービスです。

Bing Image Creator

ブラウザのBingで動作する画像生成AIです。簡単なプロンプトである程度いい感じの画像を出してくれます。

Open AIの新しい画像生成サービスDall-E 2を利用したサービスなので、品質は良さそうです。細かい調整が色々効くのかは謎ですが、手軽に使えるという意味ではベストです。

音声読み上げ系・動画作成系

まだ試していないですが紹介されているサイトも多いですし、役立ちそうなので近いうちに試してみたいです。

  • 音読さん
  • テキストーク
  • Balabolka

動画生成系はどれも無料で少しだけ使ってみて、よさそうなら契約して使うという形のものばかりですね。無料トライアルだと、動画にウォーターマークが入る感じです。

個人的には、紹介されていませんがEzLectureを購入して使ってみたいです。

画像認識系

色々ありそうですが、とりあえずMicrosoft Lobeとか良さそうだなと思います。

結論:実用性が高くなってきている、使い慣れていきたい

まだまだ足りない部分はありますが、かなり実用性が高いものになってきていると思います。

少しづつでも触っておいて慣れておこうと思います。ただ、後から参入したからといって特別不利ということもないと思いますので、思い立ったら吉日で、とりあえず触ってみるのが良いと思います。

無料でも雰囲気とか使い方の学習にはなると思います。現在無料で使えるサービスが有料化してしまって、無料分だけだと学習するのに足りなくなってしまう可能性はあるので、「いつやるか?今でしょ!」という昔はやったプロンプトがまさに当てはまる状況だと思います。

いつやるか?今でしょ!