AIの汚れた小さな秘密:それは人々によって支えられている

Mr Beasts hosts Meme Review? (he maybe does) [MEME REVIEW] ???? ????#51 (七月 2019).

Anonim

人工知能についての汚い小さな秘密があります。それは、何十万人もの人が動いています。

ベネズエラのメーキャップアーティストからインドの保守的な地域の女性まで、世界中の人々は、ストリート写真の車の周りに箱を描き、画像をタグ付けし、コンピューターでは不可能なスピーチを転記しています。

このようなデータは、自走車の交通量を増やすのに役立つ「機械学習」アルゴリズムに直接入力し、ライトを欲しいとAlexaに認識させます。 このような技術の多くは、人間がラベルを付けた膨大な量のデータがなければ機能しません。

これらの反復的な作業は、ペニーごとに支払う。 しかし、バルクでは、この仕事は世界の多くの地域で、たとえ米国であっても、妥当な賃金を提供することができます。この大がかりな大部分のコテージ業界は、人類を永遠に変える技術の基盤を表しています。傷のないコマンド、そしておそらく一日は自分自身で考えます。

___

この人間の入力産業は、検索エンジンのGoogleとBingによって長年培われてきました。 2005年以来、フリーランスの労働者と一時的なオンライン業務を兼ね備えたAmazonのMechanical Turkサービスは、世界中の研究者に群集によるデータ入力を可能にしました。

最近では、投資家はMighty AIやCrowdFlowerのようなスタートアップに数千万ドルを注ぎ込んだ。スマートフォンでも写真やその他のデータのラベル付けを容易にするソフトウェアを開発している。

ベンチャーキャピタリストのSoma Somasegarは、機械学習アルゴリズムのニーズに対応するために「数十億ドルの機会を得た」と考えています。 彼の会社、Madrona Venture Groupは、Mighty AIに投資しました。 人間は長い間、長い間、長い間来るだろうと彼は言います。

正確なラベルは、空と車の側面を区別する自走車との違いを生み出す可能性があります。テスラのモデルSは、2016年の自己駆動システムに関する最初の致命的な致命的な事態で失敗しました。

「私たちはゲームをするためのシステムを構築しているわけではなく、人命を救うためのシステムを構築しています」とMighty AIのCEO、Daryn Nakhudaは言います。

___

Marjorie Aguilar(ベネズエラのMaracaiboに住む31歳のフリーメーキャップアーティスト)は、Mighty AIの自己駆動システムの訓練を支援するために、1日に4時間から6時間かけてトラフィックオブジェクトを囲むボックスを描いています。

彼女は1時間に約50セントを稼ぐが、急激なインフレを伴う危機に瀕した国では、ほんの数時間の労働がボリバルの家賃を1ヶ月間支払うことができる。

「それはたくさんのお金のようには聞こえませんが、私にとってはかなりまともです。 「私が米ドルで支払うことがいかに重要であるかを想像することができます」

インドネシアのTegalにある3人の父親であるAria Khrisnaさん(36歳)は、eBayやAmazonなどのウェブサイト上で衣服の絵に単語タグを追加するなどして、約100ドル、彼の収入の約半分を支払うと述べています。

また、25歳のShamima Khatoonさんは、インドのMetiabruzにあるデータレーベル会社iMeritの全女性の前哨基地で、車、車線マーカー、信号灯に注釈を付ける彼女の仕事は、彼女が自宅の外で仕事をしなければならない唯一の可能性を表しています保守的なムスリム社会。

「あなたのスキルを高め、あなたの家族をサポートする良いプラットフォームです」と彼女は言います。

___

トヨタ、日産、フォードなどの大手自動車メーカー、Uberのような乗り入れ企業、Alphabet Inc.のWaymoなどの技術巨人は、しばしば第三者ベンダーを通じてラベラーを払っている。

より正確なメリットは即座に得られます。

InterContinental Hotels Groupでは、情報アシスタントのAmeliaが人から受けることができるすべてのコールが5ドルから10ドルの節約となる、と情報技術責任者のスコット・ホイガム氏は述べています。

Ameliaが失敗すると、約60人のサービスデスクの従業員のうちの1人にコールが転送されます。 それは彼らの反応から学び、次のコールでテクニックを試し、人間の従業員が他のことをやるように解放します。

Whigham氏は、「われわれはこれらの仕事を変えてきた。

コンピュータがハイアットホテルズチェーンへの顧客の電話をかけることができないときは、マサチューセッツ州フランクリンの古いレンガ造りの建物のAIコールセンターインタラクションにオーディオスニペットが送信されます。

そこでは、顧客が電話で待っている間に、ヘッドフォンを着用した「インテントアナリスト」の一人が、誤った番号から冒涜に至るまですべてを転写し、コンピュータにどのように対応するかを指示します。

その情報はシステムにフィードバックされます。 InteractionsのCTO(最高技術責任者)Robert Nagle氏は、次回は成功するチャンスがあると述べています。

___

研究者は、人間がラベル付けしたデータに対する回避策を見つけようとしましたが、その結果はしばしば不十分です。

スタンフォードの研究者Timnit Gebruは、ストリートビューの公園の車画像を使って近所の人口構成を推定したプロジェクトで、所有者のラベルを付けたCraigslist車の写真を削ってAIを訓練しようとしました。

しかし、プロダクトショットはストリートビューの車画像のようには見えず、プログラムはそれらを認識できませんでした。 結局、彼女は、彼女は彼女のデータにラベルを付けるために自動車ディーラーの専門家を雇うために3万5千ドルを費やしたと言います。

ラベリング技術会社CrowdFlowerのCEO、Robin Bordoli氏は、人間のラベラーの必要性は「巨大で」「動的」と述べています。 "アルゴリズムを100%信用することはできません。"

___

現時点では、人間が提供するいわゆる「真実の真実」のデータなしにコンピュータを学習させる方法を考え出すことは、未だに研究課題として残っている。

カリフォルニア大学バークレー校の機械学習専門家であるTrevor Darrell氏は、コンピュータアルゴリズムが人間のラベリングを必要とせずに実行することを学ぶことができるのは5〜10年後になると予想していると語る。

彼のグループは1年に何十万ドルも費やして、人々に画像に注釈を付けるのです。 「今、製品を販売していて完璧を望むなら、その種の注釈に投資しないことは間違いです。

アルファベットのWaymoやゲームメーカーのUnity Technologiesのようないくつかの企業は、すべてのオブジェクトがあらかじめ定義された制御されたシナリオでアルゴリズムを訓練するためのシミュレートされた世界を開発しています。

大抵の場合、人間をループから追い出しようとする企業さえも依然としてそれらに頼っています。

たとえば、CloudSightは、ウェブサイトやアプリの開発者に、写真をアップロードして、それを説明する言葉を戻す便利なツールを提供します。 小売業者のKohl'sは、そのアプリで「Snap and Shop」の視覚的検索機能を利用しています。

しかし、それは応答を吐き出すただのコンピュータプログラムだけではありません。 アルゴリズムがうまく答えられない場合は、インド、東南アジア、アフリカなどの800人の従業員のうちの1人が、リアルタイムで回答を入力します。

クラウドサイトの事業開発責任者、イアン・パーンズ氏は、「私たちは人間の関与なしに画像にラベルを付けることができます。 「どれくらいの時間がかかりますか」

menu
menu