2022年8月24日水曜日

株価をダウンロードする方法

 調べてみたところ、良さそうだったのが

yahoo-finance-api2

でした。

pythonでダウンロードするので、開発環境は必要になります。

2022年8月23日火曜日

NLP自然言語処理①(単語帳編)

学習前に

自然言語について興味があるけど、いろんな単語があって頭に入ってこなかったので、単語メモを書きました。

読んだ本はこれです。


自然言語処理するサンプルコードもあって、すごく丁寧に書かれていていますが、私のような初学者にとってはまず単語が分からないので、これから書く単語一覧である程度予備知識を入れてから読み始めることをオススメします。


【単語一覧】

 自然言語処理とは
 人が日常的に話している言葉をターゲットにした処理のこと。

コーパスとは
 学習データ一式のこと。

自然言語処理における機械学習とは
 事前学習モデルとファインチューニング済みモデルを使って結果出力する。

事前学習モデルとは
 大量の一般文書データ(ラベルなしコーパス)を学習させたもの。

ファインチューニング済モデルとは
 ラベリングされた文書デー(ラベルありコーパス)を学習させたもの。

ラベルとは
 何が正解かを結びつけるもの。

統計的解析手法
 SVMや解析木などを用いて、コーパス内の入力単語数をカウントしてベクトル表現を行う。
 単語の並び順を考慮しないため、単語の出現頻度で文章を判定するもの。

単語ベクトル辞書
 Word2Vecというニューラルネットワークによって一般化され、Skip-gramという手法で単層ニューラルネットワークで学習する事が可能。
 空間座標上で単語ベクトルが近しいものがクラスタ化され、単語ベクトル同士の演算で単語の意味を抽出する事ができるのが特徴。

RNNによる自然言語処理
 Seq2Seqというモデルで、時系列的に可変長の入力データを扱えるRNNで構築したもの。
 統計的解析手法と比べて文章の文脈を扱う事ができるのが特徴。

RNNとは
 入力と出力の他に内部ステータスが存在していて、単語を繰り返し入力していくと、入力履歴に基づく内部ステータスが作成されるもの。

BERTとは
 事前学習モデル+ファインチューニング済モデルというTransfermer学習モデルを決定づけた手法。
 最初にすべての単語を入力して、文章の文脈に沿った単語・フレーズ・行単位、文書全体の意味をベクトル表現することで、文書のクラス分類や部分文章の抽出などができるのが特徴。

Transformerとは
 2022年時点で最も汎用性があって精度の高いモデルで、GPTやXLMなど様々なバリエーションがあり、文章の生成や機械翻訳、要約やチャットBOTなどが行えるものがある。

Huggingfaceサイト
 80種類以上の機械学習モデルが登録されて、それらを利用できる。

利用するためのサンプルコード

pip3 install torch torchvision torchaudio
pip3 install transfermers
from transfermers import AutoTokenizer, AutoModelForMaskedLM
tokenizer = AutoTokenizer.from_pretrained("bert-base-uncased")
model = AutoModelForMaskedLM.from_pretrained("bert-base-uncased")




2022年3月14日月曜日

Firebaseとは?

 Firebaseってなに?

 Backend as a Service(通称、BasS)で、WEBページにログイン機能やコンテンツ管理など、サーバ側で実装が必要とする部分のサービスを提供しています。

Firebaseプラットフォームには19の製品があり、2022年3月現在、小規模であれば無料で利用可能です。


主なユースケース

  • WEBページ公開する場合、Hosting
  • ログイン機能を使う場合、Authemtication
  • アプリデータを保管する場合、Cloud firestore
  • 無数なコンテンツを提供する場合、Cloud Storage
  • 有数なコンテンツを提供する場合、Realtime Database


Firebaseでできること(全て)

  • Cloud firestore グローバルスケールでアプリデータを保管して同期
  • Machine Learning モバイル開発者向け機械学習
  • Cloud Functions サーバーの管理なしでモバイルバックエンドコードを実行
  • Authemtication シンプルで無料のマルチプラットフォームログイン
  • Hosting 高速かつ安全なウェブホスティング
  • Cloud Storage コンテンツを簡単に保存して提供
  • Realtime Database データをリアルタイムで保管して同期

  • Crashlytics クラッシュの追跡、優先順位付け、修復の迅速化
  • Performance Monitoring アプリのパフォーマンスに関するアクションにつながる分析情報の取得
  • Test Lab ユーザーに公開する前にラボでテスト
  • App Distribution     プレリリース版のアプリを信頼できるテスターに配布
  • Google Analytics 無料かつ無制限のアプリ解析

  • In-App Messaging コンテキストメッセージでユーザーと交流する
  • A/B Testing テストを通じてアプリ体験を最適化する
  • Cloud Messaging コストをかけずにプラットフォーム間で通知を送信
  • Remote Config その場でのアプリのコントロールと最適化
  • Dynamic Links 潜在的ユーザーをアプリ内の適切な場所にディープリンク

ざっと眺めてみるとWEBサービスで必要な機能はFirebaseを利用するとバックエンド側を気にせずにできるって所が良さそうですね。
DjangoのようにフルスタックなWEBフレームワークを使う場合は自前で用意してもよさそう。
フロントエンドだけで実装したい、何らかの理由でサーバ側を変更する事ができないなどそういったシーンで利用価値が高まりそうです。


2020年9月7日月曜日

WordpressでImagickをインストールする。


$ sudo apt install  imagemagick libmagickwand-6.q16-dev php-dev -y


php.iniに

extension = imagick.so

を入れる。


2020年9月5日土曜日

WordPressで「公開に失敗しました。 現在オフラインのようです。」と表示する。

 これはSSL対応した時に出てくる。

解決策はプラグインでSSL対応させる「Really Simple SSL」をインストールすればよい。


WordPress:テーマをアップロードすると有効期限が切れています、と出てしまう。

 これはPHPの設定でアップロードサイズ上限を超えた場合に発生するようです。

/etc/php/7.3/fpm/php.ini を開き

 upload_max_filesize
 post_max_size


を編集してApahceとPHPを再起動すればOK

wordpressの初期設定

備忘録。


1.wordpressを「/var/html/www」に展開する。
2.コマンドライン実行
$ sudo cp wp-config-example.php wp-config.php
$ sudo chmod 655 wp-config.php
$ cd /var/www/html
$ sudo chown www-data:www-data wordpress


3.Apacheインストール
  Confを調整する。
4.MySQLインストールしてDB作成
5.DB名やユーザ名、パスワードをwp-config.phpの中に記入する。

これでブラウザを開いてアクセスするとWordpressの初期設定画面になる。

2020年3月14日土曜日

依存症についての考察

【依存】
それは「ハマる」ということ。
何かに依存してしまうと禁断症状が起きる。
だから抜け出せない。
宗教やゲーム、癇癪やDVもそう、
何か憑りつかれたように繰り返してしまう事象を含め「依存」したものとして語る。

何かに依存してしまうとやらずにはいられなくってしまう。
本人も依存したものから抜け出そうとか抜け出す方法を知っているのに
禁断症状と戦った結果、
行動に移す事はできない心理状態に陥っているといっても良い。

主観的に「正しい」や「本当」だと思っている事は、自分で感じている関心事である。
関心事に偏見が含まれていたとしても、当然のように正当化してしまう傾向があり
反証を受け入れる事はできず、正常な判断は行えなくなってしまう。
こういう状態は確証バイアスというものがかかっているんだと理解しておかなくてはいけない。
じゃあどうすればその状態から脱出できるのだろうか。

禁断症状は体が覚えてしまっているので、消し去ることはできないため
まず事実を受け入れる事が重要である。
自分はこれに依存してしまっていたのか、、そんな客観性はあった方が良い。

客観性について説明するとこんな感じ。

世界に「依存した自分」と「依存した何か」が存在していて
「自分」から「依存した自分」が生まれ、
「依存した自分」と「依存した何か」は依存関係にあり、そこに副作用(体験と禁断症状)がおこっている。

このようなことが分かったとしても感性や振る舞いに左右されてしまうので
「依存した自分」を呼び出してしまったり、


「依存した何か」をリピートするかどうかは当人次第でしょうな。

2020年3月10日火曜日

VLCでAB間ループ再生する方法

やりたい時に大体忘れるからメモ。

vlc test.mp4 --start-time 10 --stop-time 13 --repeat

2020年2月18日火曜日

プログラミングしていてふと思った事

きれいなロジックより、徹底的なファクト。そしてテスト
PDCAでいえばPDA、もっと言えばDA、PとCなんて当たり前だから考えるに足らない
そのために実行計画が明確である事


これを説明するなら動詞1つまで

2019年12月4日水曜日

日本にシャオミブランド到来

なんだか最近ネットニュースみてたらシャオミ(Xaomi)製品が日本国内で販売開始するみたいですね。
Android4辺りの時に販売した時のMiブランドのスマホのインパクトはうっすらと覚えていたりします。

あの当時のインパクトを説明すると、
 ・新モデルは常に最先端技術を使っているか気にするスペックヲタ
 ・商品のデザインはアップルのような洗練された本体か気にするガジェヲタ
 ・コスパだろうという手ごろなでフラグシップモデルが買えるか気にするコスパヲタ

上のようなヲタと若者中心にユーザ受けしてた気がします。(対岸からみた感想)

きっと日本に上陸する時もそんなイメージで多くの人の目を引き付けると思う。
シャオミの開発現場も斬新で国内メーカーにはありえない体制でやってるし、製品化までのスピード感が段違い。
今後上陸する製品は先進的なものばかりだから、日本市場にも根付くことだろう。

でも自分は買わない選択肢を選んだ。
なぜなら華系ブランドの良さ悪さを知っているから二の足を踏んでしまうんだよね。
といっても多くの製品の原産国でもあるから品質は平気。
スペックも価格もデザインも良く、そんなイイモノなのになぜ買わないの?って思うことだろう。

中身はMade in chinaでも、やっぱ国産ブランドが良いんだよ!
しょせん量産モノは消耗品。
最後に勝るものは愛だね愛。

2019年11月30日土曜日

DIYのお話。

アメリカの田舎に小さな家具屋があり、そこで作ってる木の机がすごく評判で飛ぶように売れてたお店の話。
そこのお店は1点づつ手作り生産のため、1日で作れる数に限りがあります。
それにもかかわらずお客さんは絶えず来たのです。

ある日、その人気の机を買いに来た客がこういいました。
客「人気の机売ってくれないか?」
店「もう売り切れだよ」
客「遠くから来たんだ、今日中に欲しいんだ。売ってくれ」

あまりにもわがままな客に店長は怒り爆発。

客に向かってノコギリと木材を渡し、

 「DO IT YOURSELF!」(自身でやれ)

といって言いました。

お店側の対応にびっくりした客でしたが、
ほんとうに今日中に机が欲しかったのでしょうか、もしくは作ってみるというのに興味が湧いたのか
自分の手で机を作り、自分の思ってたピッタリの机を手にして満足そうに帰りました。

このお客さんはおしゃべりな人だったため、話があれよあれよと口コミが広がっていきます。
今ではこのお店は超人気店。



完成品を求める客もいれば、ワークショップをしにやってくるお客さんも定着したそうな。

---
※創作です。

2019年11月20日水曜日

UWPアプリのサイドローディングする方法

他のパソコンで作成したUWPアプリをPowerShellを使ってインストールしようとするとセキュリティポリシーエラーが発生するのを回避する方法。

PowerShellを管理者権限で実行する。

Set-ExecutionPolicy RemoteSigned

を実行する。

これで解決。

Androider