2011年4月13日水曜日

youtube-dl.py 日本語文字対応

youtubeにある猫動画をダウンロードしたいとき、
動画タイトルに日本語2バイト文字そのまま保存ファイル名に出来るようにする方法を残しておく。

保存形式はUTF-8なので注意。


1046行目付近
---
def _real_extract(self, url):
...

video_title = sanitize_title(video_title)

# simplified title
simple_title = re.sub(u'(?u)([^%s一-龠ぁ-んァ-ヴ]+)' % simple_title_chars, ur'_', video_title)
simple_title = simple_title.strip(ur'_')

# thumbnail image
...

上から3つ行目にある正規表現で全ての漢字を指定しています。
「一-龠ぁ-んァ-ヴ」


これでダウンロードしたときどの何のファイルだったか分かりやすくなって便利。

参考サイト:http://d.hatena.ne.jp/toton/20051102/1130971334
コメントを投稿

Androider