旅行好きなソフトエンジニアの備忘録

プログラミングや技術関連のメモを始めました

【C#】 レジストリへの書き込み処理でUnauthorizedAccessExceptionが発生する

レジストリにSetValueメソッドで書き込みを行おうとするとレジストリ自体は書き込み可能な設定なのにUnauthorizedAccessExceptionが発生しました。原因は以下の記事にあるように、レジストリを開く時に書き込み可能という事を明示しないといけなかったようです。

stackoverflow.com

using Microsoft.Win32;

// こうじゃなくて
//var registry = Registry.LocalMachine.OpenSubKey(name);
// こうしないとレジストリに書き込みできない
var registry = Registry.LocalMachine.OpenSubKey(name, true);

ちなみにC#レジストリを触る方法は以下にあります。
レジストリへの書き込み、読み込み、削除を行う: .NET Tips: C#, VB.NET

【Python】 処理時間の計測

前処理にどのくらい時間がかかっているか調べたかったので、pythonで時間をかかる処理を調べて以下の記事のように書けば良いことが分かりました。

qiita.com

記事を読んで勝手に秒単位でしか計測できないと勘違いしていたのですが、実際に実行してみると単位が秒というだけで秒未満の時間も測定できていました。

import time

start = time.time()
function_to_be_measured()
end = time.time()
elapsed_time = end - start

動画と音声を分離/結合する方法のメモ

動画と音声を分離/結合する方法についてメモします。ffmpegというフリーソフトで可能なようです。

動画と音声を分離する

[ffmpeg] 動画から音声を抜き出すには – 端くれプログラマの備忘録

kobiwa.net

動画と音声を結合する

kobiwa.net

【C#】 JPEGの品質を変更する

OpenCVSharpのImWriteを使うことで画像を保存できますが、品質レベル(デフォルト値95)を変えたい時どうすれば良いのか調べました。
下記のようにエンコード⇒デコード⇒ImWriteという手順で良いようです。

// 画像の読み込み
Mat image = Cv2.ImRead("lenna.png");
// 品質50でエンコードする
var buffer = new byte[image.Rows * image.Cols * image.Channels()];
var param = new ImageEncodingParam(ImwriteFlags.JpegQuality, 50);
Cv2.ImEncode(".jpg", image, out buffer, param);
// デコードして保存する
image = Cv2.ImDecode(buffer, ImreadModes.Color);
Cv2.ImWrite("compressed_lenna.jpg", image);

【異常検知】 GMM(Gaussian Mixture Model)による外れ値検知

GMMによる外れ値検出手法を試してみます。LOFやiForestのようにずばりそのものを見つけることが出来なかったので、scikit-learnにあるGaussianMixtureクラスを流用して作成します。 まずは、GMMを用いて外れ値検出を行うクラスをGMMAnomalyDetectorクラスとして、gmmanomalydetector.pyに作ります。

import numpy as np
from sklearn.mixture import GaussianMixture

class GMMAnomalyDetector:
    def __init__(self, max_n_component, covariance_type='full'):
        self._max_n_component = max_n_component
        self._covariance_type = covariance_type
        self._best_gmm = None
        self.best_n_component = -1

    def fit(self, X):
        # BIC基準でベストなクラスタ数を2~max_n_componentの範囲で探す
        lowest_bic = np.inf
        for n_component in range(2, self._max_n_component + 1):
            gmm = GaussianMixture(n_components=n_component, covariance_type=self._covariance_type)
            gmm.fit(X)
            bic = gmm.bic(X)
            if bic < lowest_bic:
                lowest_bic = bic
                self._best_gmm = gmm
                self.best_n_component = n_component

    def predict(self, X, contamination=0.1):
        # スコア下位N%を異常と見なす
        scores = np.exp(self._best_gmm.score_samples(X))
        ordered_scores = np.argsort(scores)
        anomaly_indices = ordered_scores[:int(len(scores)*contamination + 0.5)]
        # scikit-learnに倣って正常を1、異常を-1として返す
        prediction = np.ones((len(scores)), dtype=np.int)
        prediction[anomaly_indices] = -1
        return prediction


次にGMMAnomalyDetectorクラスを利用して外れ値検出を行う例をmain.pyとして以下に書きます。

import numpy as np
import matplotlib.pyplot as plt
from gmmanomalydetector import GMMAnomalyDetector

np.random.seed(42)

# Generate train data
X = 0.3 * np.random.randn(100, 2)
# Generate some abnormal novel observations
X_outliers = np.random.uniform(low=-4, high=4, size=(20, 2))
X = np.r_[X + 2, X - 2, X_outliers]

# fit the model
clf = GMMAnomalyDetector(max_n_component=10)
clf.fit(X)
# 全体の9%が異常データ
contamination = 0.09
y_pred = clf.predict(X, contamination)
# 正常を1、異常を-1と出力します
ANOMALY_DATA = -1
predicted_outlier_index = np.where(y_pred == ANOMALY_DATA)
predicted_outlier = X[predicted_outlier_index]

plt.title("Gaussian Mixture Model (k=" + str(clf.best_n_component) + ')')

a = plt.scatter(X[:200, 0], X[:200, 1], c='yellow',
                edgecolor='k', s=30, marker='o')
b = plt.scatter(X[200:, 0], X[200:, 1], c='red',
                edgecolor='k', s=30, marker='o')
c = plt.scatter(predicted_outlier[:, 0], predicted_outlier[:, 1], c='blue',
                edgecolor='k', s=10, marker='x')
plt.axis('tight')
plt.xlim((-5, 5))
plt.ylim((-5, 5))
plt.legend([a, b, c],
           ["normal observations",
            "abnormal observations",
            "observations predicted as abnormal"],
           loc="upper left", prop={'size': 12})
plt.show()

best_n_component=5となっているため、5つのクラスタに分けるのが最も当てはまりが良いと判定されたようです。 f:id:ni4muraano:20171117224444p:plain