目次

    はじめに

    AIを用いたWEBアプリを試作することになったのですが、如何せん駆け出しのフロントエンドエンジニアなので、アプリを作ってと言われても右も左もわかりません。
    そこで、ChatGPTと呼ばれる対話型の人工知能におんぶにだっこで教えてもらい、アプリを作ってみることにしました。ですがその前に、今回のアプリ製作には欠かせないOpen AIのAPIについての下調べをしていきたいと思います。



    APIについて

    APIとは「Application Programming Interface」の略で、アプリ開発者が連携して他のシステムやサービスを利用するための機能のことです。



    例えば、天気予報アプリは気象庁のAPIを使い気象データを取得、それをアプリ上で表示しています。APIを利用すればアプリ開発者は自分のアプリに他のシステムやサービスを簡単に組み込むことができます。これにより技術的な知識がなくても効率的なアプリ開発をすることができます。
    今回でいうと、Open AIのAPIを私が作るアプリに組み込むことで、アプリ上でAIを利用することができます。
    APIを利用するにはAPIキーと呼ばれる番号を発行してもらい、それを自分のアプリに組み込むことで利用できるようになります。


    Open AIのAPIについて

    Open AIにもAPIがありますが有料です。打った文字数に応じて料金が発生します。使用するモデルや言語によって従量課金の金額も変わります。また、Open AIは高い自然言語処理能力を持ったAIなので文章作成などが得意なのですが、それにもいくつか種類があります。


    チャット型

    2023年6月12日現在、Open AIで展開されている対話型のAIはGPT-3.5とGPT-4の二つが展開されています。GPT-4は限定版でOpen AIにリクエストを出して承認された人だけが使うことができます。
    すでにサービスとして展開されているChatGPTのように、AIと対話することができます。ChatGPTよりも上位のモデルなので、AIの回答の正確性も上がっているようです。

    テキスト編集型

    ユーザーが元となる文章や条件を入力し、命令に応じてテキストを編集したり生成してくれたりします。文章校正や誤字脱字の修正や翻訳作業など、対話というよりテキストデータを編集する作業をさせることができます。

    画像生成型

    DALL・Eと呼ばれる画像生成サイトが展開されており、入力されたプロンプトや既存の画像を基に、新規画像を生成したり、画像を修正したりすることができます。APIとして利用することもできます。

    音声変換型

    Whisperと呼ばれるAIは入力された音声データをテキストに変換することができます。ただ音声をテキストに変換するだけでなく、そこからさらに翻訳することなどもできます。
    既に音声を読み取りテキストに起こすサービスは存在していますが、制度が不安定な部分があります。Whisperはかなり高い精度で変換をしてくれます。

    埋め込み(ベクトル)型

    Embeddingsはベクトル表現を生成するモデルです。ユーザーに入力された単語はそのままではコンピューターが計算することができません。コンピューターが言語を数値化し、計算できるようにすることをベクトルの生成というようです。

    Open AIのAPIには他にもファイルの管理をしてくれたり、そもそもOpen AIの利用規約に反していないかを判断してくれるモデルなどが存在します。


    まとめ

    今回は人工知能を使用したWEBアプリを製作する準備としてOpen AIのAPIについて調べてみました。
    様々な種類の人工知能があり、これから先のAI事業に興味が尽きません。
    来月は実際にVueを使用してWEBアプリを作成してみたいと思います。


    最後までお読みいただきありがとうございました。 また来月のLabでお会いしましょう。 それではまた。
    PREV
    2023.06.12
    UXライティングとは?UXを向上させるテキストコンテンツの重要性
    NEXT
    2023.06.14
    テキストナビゲーションアニメーション