2024年3月– date –
-
Programming
Windowsで使用したファイルをMacのJUMAN++で解析する際の注意事項
JUMAN++はLinux系(Mac)の方が簡単に使える。そのため、普段はWindowsを使っているがJUMAN++を使用するときだけLinux系(Mac)を使いたい場合がある。その時の注意事項としては以下の2点が挙げられる。1.ファイルのエンコーディング ←特に大事2.改行コ... -
G検定
ノーフリーランチ定理(No Free Lunch Theorem)
ノーフリーランチ定理 あらゆる問題において高い精度を出せる汎用的なモデルは存在しない 全てを解決できる万能AIは存在しない→画像データ分析:ニューラルネットワーク→購買履歴データ分析:決定木考える要素:目的、データの種類、データ処理方法、分析... -
G検定
特徴量エンジニアリング(Feature Engineering)
特徴量エンジニアリング操作:(1)予測変数の選別、(2)データの前処理(1)予測変数の選別: 家賃を求めたい時に、電話番号はいらない。 保険契約に、身長はいらない。(2)データの前処理: 年月日を年数に変える(年齢、築年数な... -
G検定
特徴量(Feature/Attribute)
特徴量分析対象の予測の手掛かりとなる変数 【例1.お菓子】 お菓子は、形や味、色などいろんな特徴があるでしょう?それと同じように、特徴量もデータの中の個々の要素や特徴を表します。 例えば、クッキーやチョコレート、キャンディーなど、それぞれの... -
G検定
半教師あり学習(Semi-supervised Learning)
半教師あり学習教師あり学習(正解データあり) × 教師なし学習(正解データなし)正解データ付きデータが不十分な時(正解データを作るのに人間の時間がかかる)正解データから、正解データなしの正解を予測する 精度は下がる →時間があるなら人間... -
G検定
回帰問題の種類(Types of regression problems)
不思議な国への扉が今、開かれます。ある遠い、遠い世界の中心に、予測の力を司る不思議な国があります。この国の王様(それは、あなたです)は、国を繁栄させるため、そして未来を見通すための特別な力を持っています。それは、「魔法の道具」を使って、... -
G検定
回帰問題(Regression Problem)
回帰問題は、お絵かきで例えると、先生が「このネコはどれくらい大きいかな?」と聞いてくるようなものです。コンピューターは、ネコの大きさを数字で表さなくてはいけない。たとえば、「このネコは10センチメートルだよ」とかですね。コンピューターが回... -
G検定
教師なし学習(Unsupervised Learning)
教師なし学習は、答えがないクイズをパソコンが自分で解くことです。たくさんの写真を見せても、どれがネコでどれがイヌかは教えない。でも、パソコンは写真をよーく見て、似ているもの同士をグループに分けて、「これらはなんか似ているから、きっと同じ...
1