电战 ~ AI 能让人发笑吗?AWS 和支持挑战的技术_第1页
电战 ~ AI 能让人发笑吗?AWS 和支持挑战的技术_第2页
电战 ~ AI 能让人发笑吗?AWS 和支持挑战的技术_第3页
电战 ~ AI 能让人发笑吗?AWS 和支持挑战的技术_第4页
电战 ~ AI 能让人发笑吗?AWS 和支持挑战的技术_第5页
已阅读5页,还剩36页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

©

2020,

Amazon

Web

Services,

Inc.

or

its

affiliates.

All

rights

reserved.電笑戦~

AI

は人を笑わせられるのか?挑戦を支える技術とAWS

~針原佳貴(Yoshitaka

Haribara)スタートアップML

ソリューションアーキテクトアマゾンウェブサービスジャパン株式会社Agenda『電笑戦』の概要についてアマゾンウェブサービスジャパン針原佳貴サンプルモデルの説明

電通デジタル

石川

隆一『電笑戦』参加各社様の開発モデル説明ストックマーク株式会社

森長

誠カラクリ株式会社

武藤

健介吉本興業株式会社

田中

爽太まとめ

アマゾンウェブサービスジャパン

針原

佳貴写真で一言ボケて例題ボケての人気ボケボケて電笑戦©

2020,

Amazon

Web

Services,

Inc.

or

its

affiliates.

All

rights

reserved.石川隆一(Ryuichi

Ishikawa)株式会社電通デジタル(DentsuDigital

inc.)自己紹介石川

隆一

Ryuichi

Ishikawa電通デジタル

AIクリエーティブ開発グループAIエンジニア/クリエーティブテクノロジスト2014年昭和音楽大学学士ミュージシャン活動後、レコード会社にてアーティストマネージャーを経

て、ふとAIを習得。2018年、電通デジタル入社。データ分析・画像分析・自然言語処理など、様々なジャンルにおけるAIのクリエーティブ応用を研究している。AI関連の論文は毎日チェックし、情報は常にアップデート。人工知能学会JSAI2020/JSAI2019/

画像シンポジウム学会

MIRU2019などで論文執筆趣味

Kagglea

surfer

riding

on

a

wave深層学習を用いた画像の要約モデルは右の図を参照画像の要約では、2014年頃から盛んに研究が行われるようになった

Encoder・Decoderモデルとなっている。ImageNetにて学習されたVGG16(Encoder)の全結合層から画像のベクトルを抽出し、RNNやLSTM(Decoder)などの時系列アルゴリズムに繋げることで画像を要約する。1単語ごとに出力し、出力を更に入力として用いることで文章として成立させる仕組みとなっている。深層学習を用いた画像の要約深層学習を用いた画像の要約入力画像入力テキストNo

Textご主人様入力画像入力テキストご主人様ご主人様が入力画像入力テキストご主人様がご主人様が捕らわれてループ文章の出力def

sample(preds,

temperature=1.0):preds

=np.asarray(preds).astype('float64’)‘’’自然対数を取り、引数の値で割る。引数の値が大きいほど確率の低い単語も選ばれやすくなる。’’’preds=np.log(preds)/temperature’’’自然対数を元に戻す’’’exp_preds

=

np.exp(preds)‘’’総和が1となるように全値を総和で割る’’’preds=exp_preds/np.sum(exp_preds)’’’多項分布に基づいた乱数を用いて単語を決定する’’’probas

=

np.random.multinomial(1,

preds,1)return

np.argmax(probas)©

2020,

Amazon

Web

Services,

Inc.

or

its

affiliates.

All

rights

reserved.森長誠(Makoto

Morinaga)ストックマーク株式会社(Stockmark

Inc.)ストックマークの紹介会社名 ストックマーク株式会社オフィス東京都港区南青山1丁目12-3LIFORK

MINAMI

AOYAMA

S209設立2016年11月15日創業者代表取締役CEO

林達取締役CTO

有馬幸介従業員数

60名事業内容自然言語処理技術を活用したビジネス意思決定サポートサービスの提供自然言語処理✕ディープラーニングビジネスインサイトを導出電笑戦モデル概要紹介教師データボケ缶:SP(300ボケ)、Red(8,500ボケ)※同一画像のボケは排除ビジネス記事のタイトルと及び画像データ(20,000件)前処理ボケ及び記事タイトルをMecab+Neologdで形態素解析後、トークン化(語彙数は約25,000)モデルEncoder–Decoder

モデル(ResNet+双方向LSTM+Attention+Dropout)トレーニングAmazon

EC2

p3.2xlargeで3時間程度後処理出力に対して、一部の名詞をBERTの穴埋め予測で置換モデル開発で効果があった施策教師データの水増しボケだけでなく、ビジネス記事のタイトルとその画像データを教師データに含め、真面目な文章とボケを組み合わせ。例)「イタリア、新型コロナの感染者1万人超え中国が医師団派遣へ」「ロシアにおけるサイバー犯罪、1年間で92%増」「イノベーション成功の鍵とは何か」学習の早期切り上げボケに特徴的なキーワードが使われるパターンが多いため、収束すると教師データとほぼ同じ結果を出力してしまう例)「上杉軍から塩が届いてテンション上がりまくりの武田軍」「ディアゴスティーニで届くパーツがすべて完成品でつまらない。」「ブルーハワイって結局何味なんだろうね?」モデル開発で効果があった施策BERTの穴埋めによる単語置換BERTは事前学習で穴埋め問題を解いていますので、それを利用して、一部の単語をマスクして、マスクされた単語の前後の文字列から単語を予測して置換します。例)原文「本日は良い天気だ」マスク「本日は良い[MASK]だ」予測 「本日は良い値動きだ」モデル開発での気付きどうしておもしろいかをモデルが分かっていないボケのエッセンスを学習しているのではなく、正解に近いボケを生成しているだけ数を打てば当たるような形になってしまう画像の細かな特徴を活かせていないおおまかな特徴をとらえているので、連想的なボケには良い画像自体がおもしろい場合に上手くボケれていないケースがある渾身のボケ本戦への意気込み先ほどのボケのようにまだボケ缶の教師データを越えられているとは言えません。提供されている教師データからボケの特徴のみをとらえ、ボケを生成できるように本戦までに他にも色々な手法でチャレンジします!©

2020,

Amazon

Web

Services,

Inc.

or

its

affiliates.

All

rights

reserved.武藤健介(Kensuke

Muto)カラクリ株式会社(Karakuri

Inc.)CS

TechオンラインAI大学カラクリ株式会社AI技術を用いたカスタマーサポートのデジタル化チャットボットを用いた問い合わせ対応チャットログ分析によるサービスの改善提案YouTube

チャンネル好評配信中!前処理・モデル・トレーニング前処理「4人以上がいいねした」ボケ(約20万件)画像から複数の物体を検出モデル「画像から抽出した物体の特徴」から「ボケ」への翻訳モデルNeurIPS2019(トップカンファレンス)に採択された手法トレーニングDeep

Learning

AMI、Amazon

EC2

p3.2xlargeで学習開発の試行錯誤難しい点画像の状況を適切に表すボケを生成するのは難しい画像中に複数の物体がある場合、何が写っているのか正確に認識する必要がある物体の関係を正しく認識してボケる必要がある工夫した点それぞれの画像から複数の物体を検出する前処理を行った物体間の相対的な位置やサイズの情報を用いて学習を行った物体の空間的関係man

80%baby

70%watch90%画像中の物体検出機械の認識物体の空間関係の重要性man

80%baby

70%watch90%≠watch

90%baby

70%man80%モデルの概略渾身のボケ「お前、俺の事好きなんだ…」「パパ、ママ、この子の方がいいの?」渾身のボケ学習時間ボケ24000「この子は?」40000「パパ、ママの家に帰ってきたよ」66000「パパ、ママ、この子の方がいいの?」86000「お前、この子のこと好きなんだろ?」学習時間ごとのボケ「全力で、笑いのカラクリを探求します!!」電笑戦本選への意気込み©

2020,

Amazon

Web

Services,

Inc.

or

its

affiliates.

All

rights

reserved.田中爽太(Sota

Tanaka)吉本興業株式会社(Yoshimoto

Kogyo

Co.,Ltd.)吉本興業株式会社吉本興業カンパニー子会社・関連会社34社創

1912年(明治45年)4月1日社員数

865名(男性461名 女性404名)2019年6月現在タレントマネジメントのみならずエンタテイメントに関わる企画・制作・PR・流通を日本全国47都道府県から、アジア・海外まで総合的に展開できる企業です!システム概要Rule-baseddataextractionInputOutputAmazonSageMakerVGG16ImageTaggedbokete

dataTextAmazonSageMakerWriters/DirectorAnnotationEmotion/Face

DetailAmazonRekognitionObjectSimilarityBokeEvaluation「写真で一言」の面白いとは?・あくまで一理論だが「ズレ」を「共感」した時・「ズレ」るために写真を正しく認識/解釈する→Amazon

Rekognitionを利用し精度高く認識→抽出ベースによってズレを表現コンセプト企画コンセプト・大喜利の答えとして面白く技術コンセプト・大喜利などお笑いに長けた構成作家やディレクターがボケて回答データを分析/分類・企画側とエンジニア側で一緒にPDCAを回せる仕組み/ツールを考案お客さんズレ答え「分かった。俺が行く。表に乳母車回しとけ。」赤ちゃん(=かわいい)帽子を

被っている確かに!

分かる分かる共感ツール作家/ディレクターが使いやすいツールを開発

簡単にタグ付け出来るようにアノテーションツールを

AWSサービス上で作成。516件の画像とBokeのペアをタグ付けしたシステムの評価を簡単に出来るようにチャットと連携AWS

Lambda(Vue.js)Amazon

DynamoDB

Amazon

API

Gateway++ボケてデータ分析得られた洞察①人の写真が多く、その表情やセリフを言わせたボケが多い→人/表情/口の開閉の認識を重視得られた洞察②bokete上では長文/説明調等bokete独特な回答が評価高→イベントに向けて使用するデータの精査が必要得られた洞察③ズレを生みやすいお題(外国人)、ズレた回答(ないない)などが評価高タグ回数人404セリフ285外国人284状況266表情257ポーズ250ないない248あるある157Star

1000未満Star

1000以上セリフ75.36%人81.22%人70.29%外国人61.11%状況43.48%状況54.50%表情43.48%ないない52.91%ポーズ41.30%表情52.12%外国人38.41%ポーズ51.06%あるある34.78%セリフ47.88%ないない34.78%bokete独特35.71%第三者12.32%イベント不向き34.66%笑顔7.25%あるある28.84%

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论