グーグル翻訳をPythonでスクレイピング [プログラミング]
英語の勉強にジブリ映画の北米版を観たり聞いたりしてる。
字幕を追いかけるのが面倒なのでネットからスクリプトをゲット。
ただ、ちょっと意訳っぽい感じで日本語版と微妙に異なってる。
英語スクリプトの対訳が欲しい。
で、グーグル翻訳に思い至った。
ネットで調べるといろいろと出てくる。さっそくPythonで動作確認。が、どれもまともに動作しない。
どうやらPythonスクレイピング対策でいろいろとタグが変わってるみたい。まぁ、当然だな。
でも、そうなると出来る方法を模索してしまう。
結果、selenium、chromedriver、BeautifulSoupなどを使って動くようになったのでネットに恩返し。
とりあえずエッセンスコードだけ置いておきますね。
from selenium import webdriver
from selenium.webdriver.chrome.options import Options
from bs4 import BeautifulSoup
import urllib.parse
options = Options()
options.add_argument('--headless')
browser = webdriver.Chrome(chrome_options=options)
browser.implicitly_wait(3)
english = 'This is a pen.'
url_text = "https://translate.google.co.jp/#en/ja/{0}".format(english)
url = urllib.parse.quote_plus(url_text, "/:?=")
browser.get(url)
result = BeautifulSoup(browser.page_source, "html.parser").find(class_ = "tlid-translation translation").text
print(result)
browser.quit()
字幕を追いかけるのが面倒なのでネットからスクリプトをゲット。
ただ、ちょっと意訳っぽい感じで日本語版と微妙に異なってる。
英語スクリプトの対訳が欲しい。
で、グーグル翻訳に思い至った。
ネットで調べるといろいろと出てくる。さっそくPythonで動作確認。が、どれもまともに動作しない。
どうやらPythonスクレイピング対策でいろいろとタグが変わってるみたい。まぁ、当然だな。
でも、そうなると出来る方法を模索してしまう。
結果、selenium、chromedriver、BeautifulSoupなどを使って動くようになったのでネットに恩返し。
とりあえずエッセンスコードだけ置いておきますね。
from selenium import webdriver
from selenium.webdriver.chrome.options import Options
from bs4 import BeautifulSoup
import urllib.parse
options = Options()
options.add_argument('--headless')
browser = webdriver.Chrome(chrome_options=options)
browser.implicitly_wait(3)
english = 'This is a pen.'
url_text = "https://translate.google.co.jp/#en/ja/{0}".format(english)
url = urllib.parse.quote_plus(url_text, "/:?=")
browser.get(url)
result = BeautifulSoup(browser.page_source, "html.parser").find(class_ = "tlid-translation translation").text
print(result)
browser.quit()
MTBはやっぱりオフロード! [自転車 昼トレ]
仕事お休みして気分転換 [お出かけ]
昨日は仕事をお休み。さいきんストレスが半端なくこのままでは無力感で壊れる。
自分の努力で何とかできるなら何とかしたいが無理なものは無理。
でも、それが言えない立場。苦しい。
で、気分転換。
湖岸の公園で読書でもと出かけたが琵琶湖博物館近くを通ったので寄ることに。
ここは年間パスポートがあるし駐車場も無料。
樹冠トレイル歩いて水族展示を見てぶらぶら散歩。(^○^)
その後はひさしぶりに温泉。
ピエリ守山にオープンしたばかりの温泉施設、水春。
何となく週末は混雑してそうなので避けてたけど、平日なら大丈夫だろうと。
人づてにあまり広くはないと聞いていたけど十分広い。目隠しはあるけど琵琶湖を一望できる。
長命寺のお風呂も気に入ってるけどはっきり言って高い。あまり行けない。
それに比べると水春はチェーン店。平日なら850円。\(^o^)/
今度は週末も一度挑戦してみよう。o(^-^)o
それにしてもピエリ守山、一時は廃墟で有名になったが生まれ変わったなぁ。
運営が変わるだけどこれほど復活するとは。あとは映画館だな。(^○^)
自分の努力で何とかできるなら何とかしたいが無理なものは無理。
でも、それが言えない立場。苦しい。
で、気分転換。
湖岸の公園で読書でもと出かけたが琵琶湖博物館近くを通ったので寄ることに。
ここは年間パスポートがあるし駐車場も無料。
樹冠トレイル歩いて水族展示を見てぶらぶら散歩。(^○^)
その後はひさしぶりに温泉。
ピエリ守山にオープンしたばかりの温泉施設、水春。
何となく週末は混雑してそうなので避けてたけど、平日なら大丈夫だろうと。
人づてにあまり広くはないと聞いていたけど十分広い。目隠しはあるけど琵琶湖を一望できる。
長命寺のお風呂も気に入ってるけどはっきり言って高い。あまり行けない。
それに比べると水春はチェーン店。平日なら850円。\(^o^)/
今度は週末も一度挑戦してみよう。o(^-^)o
それにしてもピエリ守山、一時は廃墟で有名になったが生まれ変わったなぁ。
運営が変わるだけどこれほど復活するとは。あとは映画館だな。(^○^)
またまたオフロード [自転車 昼トレ]
と言うことで、って、昨日の続きで昼トレ登りはオフロード。せっかく落枝を片付けたし、どのくらい登れるか。基本このコースはきつすぎるのでタイムは気にしない。でも、できれば足つきなしで。今は大きな倒木があるのでそこは無理だけど。
オフロードコース入り口。先ずは急傾斜のコンクリート道から。
中盤にある最初の倒木。これは何とかどかしたい。
このコースの山場。一番きつい直線登りは真ん中くらいに倒木がある。その後はなかなか再スタートできず緩やかになるまで押してしまった。
これもどかせそうだけど根が付いてるので無理。
崩落個所が意外にきつい。シューズ裏に土がつまる。
結果、そこそこ頑張れた。それでも倒木や崩落が無ければまだまだ足つきなしは出来そうだ。
ボタンザクラ、いまが一番の見頃。
このコースまたしばらくはやみつきになりそう。o(^-^)o
オフロードコース入り口。先ずは急傾斜のコンクリート道から。
中盤にある最初の倒木。これは何とかどかしたい。
このコースの山場。一番きつい直線登りは真ん中くらいに倒木がある。その後はなかなか再スタートできず緩やかになるまで押してしまった。
これもどかせそうだけど根が付いてるので無理。
崩落個所が意外にきつい。シューズ裏に土がつまる。
結果、そこそこ頑張れた。それでも倒木や崩落が無ければまだまだ足つきなしは出来そうだ。
ボタンザクラ、いまが一番の見頃。
このコースまたしばらくはやみつきになりそう。o(^-^)o
オフロードコースの手入れ [自転車 昼トレ]
なかなか暖かくならない。出かける気分にもなれず、土日は連続でジムクライミング。
KO-WALL月会員なのでお金もかからずこれが一番。(^^;ゞ
今日の昼トレはルモンタウンから走井林道を登り馬頭観音堂へ。九十九折れのボタンザクラが満開。まだまだ寒いけど我慢できなかった感じ。(^○^)
花粉なのかPM2.5なのか霞んでる。
そして下りはオフロードコースに。登りを楽しむために少しコースの整備を。中小の落枝を除去。下りでは面白い落枝も、急傾斜での登りでは楽しめない。私的には登りを楽しみたいので勝手に掃除させていただきました。m(__)m
それでも3箇所の大きな倒木は一人では無理。と言うかチェーンソーとか無いと無理。間伐作業とかで林業関係者に入ってもらうまで放置かな。朽ち始めたら人力でもなんとかなるかも。
KO-WALL月会員なのでお金もかからずこれが一番。(^^;ゞ
今日の昼トレはルモンタウンから走井林道を登り馬頭観音堂へ。九十九折れのボタンザクラが満開。まだまだ寒いけど我慢できなかった感じ。(^○^)
花粉なのかPM2.5なのか霞んでる。
そして下りはオフロードコースに。登りを楽しむために少しコースの整備を。中小の落枝を除去。下りでは面白い落枝も、急傾斜での登りでは楽しめない。私的には登りを楽しみたいので勝手に掃除させていただきました。m(__)m
それでも3箇所の大きな倒木は一人では無理。と言うかチェーンソーとか無いと無理。間伐作業とかで林業関係者に入ってもらうまで放置かな。朽ち始めたら人力でもなんとかなるかも。