丹尼爾糕 Profile picture
Dec 16, 2021 8 tweets 6 min read Read on X
今天看的是 NAVER DEVIEW 的 For Better Image Translation (Papago Image/AR Translation) tv.naver.com/v/23649339 #NAVER #DEVIEW
主要在講 Papago App (Naver出的翻譯軟體) 中對於圖片翻譯的改善技術。講得有條有理,而且投影片也做得很棒!
這幾張 slide 很清楚地描述了圖片(in-place)翻譯的四個步驟:1. 文字認識, 2. 組成單字, 3. 機器翻譯, 4. 重繪出結果。這個演講的主題主要是在講如何改善第二步和第四步,讓翻譯效果在某些情況下可以有更好的表現。最後還有一個 section 是在講即時翻譯的技術。 ImageImageImageImage
在組成單字,句子,和段落時,如果遇到圖片是菜單、收據,或是商品包裝上的介紹時,換行的位置常常需要判斷是要當成同一行,還是是不同的項目。這邊利用了 BERT 技術來做這個判斷。從第三張圖可以看出來,有了精準的斷行分析後,在產出結果時,不會再把每行黏在一起。 ImageImageImage
再來是講到繪製翻譯結果的改善:從第一張圖可以看得出來,翻譯後的文字背景很人工,是很明顯的色塊。這裡利用了 GAN 的技術,去更有效地算出文字的背景和前景,還跟其他演算法的效果做了比較。(中間有一大段聽不懂)。 ImageImageImageImage
從改善前改善後的差異看得出來,有了很明顯的進步,幾乎看不出來翻譯的文字是貼上去的,完全跟原本的圖片背景融合在一起。 ImageImage
最後一段講的是即時翻譯,這邊有利用到 object tracking 的技術,大概的步驟是:1. 找出代表性的 frame, 2. 進行該 frame 的翻譯, 3. 持續利用 Optional flow 的方式追蹤翻譯好的區塊並重繪。 ImageImage
我試了一下用 Papago App 跟 Google Translate 來翻譯這篇演講的大綱韓文版。先不論翻譯的結果,單就呈現效果來說, Papago 的效果確實好太多了。 ImageImageImage
另一個有不同背景顏色和前景顏色的翻譯繪製效果。看起來好的那個是用 Papago App 翻譯的。 ImageImageImage

• • •

Missing some Tweet in this thread? You can try to force a refresh
 

Keep Current with 丹尼爾糕

丹尼爾糕 Profile picture

Stay in touch and get notified when new unrolls are available from this author!

Read all threads

This Thread may be Removed Anytime!

PDF

Twitter may remove this content at anytime! Save it as PDF for later use!

Try unrolling a thread yourself!

how to unroll video
  1. Follow @ThreadReaderApp to mention us!

  2. From a Twitter thread mention us with a keyword "unroll"
@threadreaderapp unroll

Practice here first or read more on our help page!

More from @plateau

Jan 19, 2022
今天看的是 2020 NAVER DEVIEW 的 "アンドロイドメディアフレームワークを活用した動画プレーヤー作り"(tv.naver.com/v/16971183/lis…),在講如何在 Android 平台上自己做一個 media player。沒想到竟然有這種純講實作的 session,完全沒有講到他們的產品,還附上了 github link: github.com/jeehwan/MediaP…
不意外地,講者來自於 Naver E-Tech 部門;當然一開始還是會簡介一下 E-Tech 以及他在這部門中擔任的角色。由於他負責的就是 PRISM Mobile LIVE/VOD SDK,也難怪他會來分享怎麼實作 media player。
Agenda 很簡潔,先說明 video 是怎麼組成的,再簡單說明一下 Android framework 內建的 media player 架構;然後說明他是怎麼利用其中的兩個元件,自己寫了一個 media player,以及過程中一些需要處理的問題。
Read 13 tweets
Jan 15, 2022
今天看的是 2021 LINE DEV Day 的 プッシュ通知到達率100%を目指して - データ解析で得られた知見 () 由 Shoji 主講,分享了 LINE Official Account App 的用途,
以及如何透過分析數據發現 Android 通知會有太晚抵達的狀況,然後針對不同的參數去做 ab testing 找出比較好的結果,當然也有發現某些條件的開關並沒有太大影響,像是 DnD mode 和 Background restriction。
提到 Dogfooding 的好處,但沒詳細說明 dogfooding 的作法。還有講到:發現 Android 平台有 not documented 的細節:當 non-foreground notification 超過一定限制時,可能會被系統忽略。雖然可以利用 adb shell dumpsys notification 看到 quota,但沒有 API 可以取得這數字。
Read 4 tweets
Jan 11, 2022
今天轉換一下心情,看的是 2021 LINE DEV Day Keynote ()。只有30分鐘左右,用加速看的話,一下子就看完了。裡面內容不多…前八分鐘在介紹這十年來的演進,以及推出的一些服務,包含比較後期推出的內部系統 IU 和 verda。
接著是由 Isago-san (CEO of AI Company) 介紹 Hyper Clova service,舉了幾個例子,像是利用 AI技術產生電商可能需要的商品說明,還有跟愛ちゃん互動(不知是不是真的)。下面這張圖,其實看不出來真正需要被解釋的地方。
第三部分是由 Yoneyama-san (LVC Corp. Executive Officer) 介紹 LINE 推出的 blockchain eco-system 以及最近很夯的話題 NFT。對於 blockchain 兩大最被提及的問題:1. 耗電耗 CPU:LINE 的系統是採用 PoS 而不是 PoW,所以不會有這問題;
Read 8 tweets
Jan 6, 2022
今天看的是 DEVIEW 2020 的 Papago Image Translate (tv.naver.com/v/16969172)。果然還是這類結合圖像影像應用的技術比較吸引我,也比較好懂。跟2021 年的 DEVIEW 針對 Papago APP 講的進階改善(threadreaderapp.com/thread/1471497…) 比起來,這篇是比較基礎地介紹圖像文字翻譯功能。
大綱是:
1. 圖像翻譯為何
2. 將文字階層化
3. 編輯文字
4. 如何評價圖像翻譯的性能
早期 papago app 對於圖像翻譯功能的定位在於:去國外旅行的使用者,需要買東西時在商品上面看相關的說明。這個功能的使用率每年以兩倍以上的速度在成長,應用也開始擴及到了日常應用,看 SNS 內容,或是學習語言的人,用來看另一個語言的內容。
Read 13 tweets
Jan 4, 2022
昨天跟今天看的是 DEVIEW 2020 的 Avatar imitating me: from model development to mobile application (tv.naver.com/v/16970573),主要內容是在講怎麼透過建立 model 來抓取影片中人物的 3D 行為,再到怎麼樣將這些資料整合到 SDK 中,應用到 App 裡。
早期的動作偵測比較土炮,還要在身上裝 sensor,現在由於人手一台手機,所以技術也開始朝著無 sensor ,利用 deep learning 來抓取這些資訊。
幾張說明 model, sdk, application 之間關係的圖表。
Read 10 tweets
Dec 30, 2021
今天看的是 如何提高 KakaoGameSDK 的 Robustness (if.kakao.com/session/101)。之前有接過維護 SDK 的經驗,這篇有些經驗可以做為參考。
Agenda 如下:
1. KakaoGameSDK 簡介
2. 如何處理 patch 的不確定性
3. 當問題發生時,如何有彈性地處理
4. 在不同環境中採用 SDK
KakaoGameSDK 是個用來利用許多家 provider 提供的登入機制,讓使用者可以進入 Kakao 遊戲的 SDK。除了利用 Kakao APP 的聯動外,其他主流的登入方式也都有支援。SDK 支援蠻多平台,其中包含 iOS, Android, Windows;也有 Javascrip 用的 SDK。
Read 9 tweets

Did Thread Reader help you today?

Support us! We are indie developers!


This site is made by just two indie developers on a laptop doing marketing, support and development! Read more about the story.

Become a Premium Member ($3/month or $30/year) and get exclusive features!

Become Premium

Don't want to be a Premium member but still want to support us?

Make a small donation by buying us coffee ($5) or help with server cost ($10)

Donate via Paypal

Or Donate anonymously using crypto!

Ethereum

0xfe58350B80634f60Fa6Dc149a72b4DFbc17D341E copy

Bitcoin

3ATGMxNzCUFzxpMCHL5sWSt4DVtS8UqXpi copy

Thank you for your support!

Follow Us!

:(