tag:crieit.net,2005:https://crieit.net/users/noko_gbs/feed kono 16の投稿 - Crieit Crieitでユーザーkono 16による最近の投稿 2020-10-30T19:46:03+09:00 https://crieit.net/users/noko_gbs/feed tag:crieit.net,2005:PublicArticle/16181 2020-10-28T00:50:39+09:00 2020-10-30T19:46:03+09:00 https://crieit.net/posts/C-DateTime-ValueObject-5f9841cf877d6 C# の DateTime で説明する ValueObject <h2 id="ValueObject イズ 何?"><a href="#ValueObject+%E3%82%A4%E3%82%BA+%E4%BD%95%EF%BC%9F">ValueObject イズ 何?</a></h2> <p>ValueObject とは「何らかの概念についての状態と振る舞いを持ち、その概念の責務を果たすオブジェクト」です。<br /> ValueObject はそれが定義される上で満たすべきいくつかの要件があります。<br /> IDDD 本で示されている ValueObject が満たすべき要件を確認してみたいと思います。</p> <div class="table-responsive"><table> <thead> <tr> <th>No.</th> <th>要件</th> <th>説明</th> </tr> </thead> <tbody> <tr> <td>1</td> <td>計測・定量化・説明</td> <td>そのドメイン内の何かを計測したり定量化したり、あるいは説明したりする。</td> </tr> <tr> <td>2</td> <td>不変</td> <td>状態を不変に保つことができる。</td> </tr> <tr> <td>3</td> <td>概念的な統一体</td> <td>関連する属性を不可欠な単位として組み合わせることで、概念的な統一体を形成する。</td> </tr> <tr> <td>4</td> <td>交換可能性</td> <td>計測値や説明が変わったときには、全体を完全に置き換えられる。</td> </tr> <tr> <td>5</td> <td>値の等価性</td> <td>値が等しいかどうかを、他と比較できる。</td> </tr> <tr> <td>6</td> <td>副作用のない振る舞い</td> <td>協力関係にあるその他の概念に、副作用のない振る舞いを提供する。</td> </tr> </tbody> </table></div> <p>引用 : <a target="_blank" rel="nofollow noopener" href="https://www.amazon.co.jp/dp/B00UX9VJGW/ref=dp-kindle-redirect?_encoding=UTF8&btkr=1">ヴァーン・ヴァーノン. 実践ドメイン駆動設計</a></p> <p>どうでしょう、初見で理解出来ましたか?<br /> 「全然わからん」となったそこのあなた。もしあなたが C#er なら ValueObject は怖くありません。<br /> あなたは既に ValueObject を知っているからです。</p> <p>人間誰しも自分の理解していない事柄に対しては拒絶感を抱きやすいものですが「既に知っている」となればどうでしょうか。<br /> この記事は「まだ ValueObject をあまり知らない方」に向けた「ValueObject に対する拒絶感を和らげる」ために書かれた記事です。</p> <h2 id="DateTime で説明する ValueObject"><a href="#DateTime+%E3%81%A7%E8%AA%AC%E6%98%8E%E3%81%99%E3%82%8B+ValueObject">DateTime で説明する ValueObject</a></h2> <p>C# には日時を取り扱うための構造体として DateTime があります。C#に触れたことがある人ならば一度は見たことがあるのではないでしょうか。<br /> この DateTime ですが実はある種の ValueObject です。<br /> 嘘ではありません。<br /> それでは DateTime で ValueObject の要件を説明していきましょう。</p> <h3 id="計測・定量化・説明"><a href="#%E8%A8%88%E6%B8%AC%E3%83%BB%E5%AE%9A%E9%87%8F%E5%8C%96%E3%83%BB%E8%AA%AC%E6%98%8E">計測・定量化・説明</a></h3> <p>言わずもがな DateTime は日時を示す為の構造体です。<br /> 日時に関しておおよそ一般的な定義や振る舞いを提供してくれます。</p> <h3 id="不変"><a href="#%E4%B8%8D%E5%A4%89">不変</a></h3> <p>DateTime は読み取り専用構造体として定義されておりインスタンス生成後に状態を変更することは出来ません。<br /> 「状態を不変に保つことができる」と言うより「状態が不変であることを強制されている」と言う方が正しいかもしれません。</p> <pre><code class="csharp"> public readonly partial struct DateTime : IComparable, IFormattable, IConvertible, IComparable<DateTime>, IEquatable<DateTime>, ISerializable, ISpanFormattable </code></pre> <p>引用 : <a target="_blank" rel="nofollow noopener" href="https://source.dot.net/#System.Private.CoreLib/DateTime.cs,df6b1eba7461813b">.NET Core Source Browser DateTime.cs</a></p> <p>既に存在する DateTime インスタンスとは別の日時が欲しい場合は常に新しいインスタンスとして生成されます。<br /> 一例として AddDays メソッドの定義を見てみます。</p> <pre><code class="csharp"> public DateTime AddDays (double value); </code></pre> <p>引用 : <a target="_blank" rel="nofollow noopener" href="https://docs.microsoft.com/ja-jp/dotnet/api/system.datetime.adddays?view=netcore-3.1">DateTime.AddDays(Double) メソッド | Microsoft Docs</a></p> <p>戻り値が DateTime になっていますが、この戻り値について MS Docs の説明にはこう書いてあります。</p> <pre><code>このインスタンスの値に、指定された日数を加算した新しい DateTime を返します。 </code></pre> <p>引用 : <a target="_blank" rel="nofollow noopener" href="https://docs.microsoft.com/ja-jp/dotnet/api/system.datetime.adddays?view=netcore-3.1">DateTime.AddDays(Double) メソッド | Microsoft Docs</a></p> <p>上記の通り新しいインスタンスを返却します。自身の状態を変更して自身の参照を返す訳ではありません。<br /> AddMonths メソッドや AddYears メソッドも同様です。</p> <h3 id="概念的な統一体"><a href="#%E6%A6%82%E5%BF%B5%E7%9A%84%E3%81%AA%E7%B5%B1%E4%B8%80%E4%BD%93">概念的な統一体</a></h3> <p>ここに「2000」という数字があるとします。この数字は、これだけでは殆ど価値のある意味を持ちません。<br /> ですが「年」という言葉と組み合わせると「2000 年」になり、只の「2000」よりも具体的な意味を示すようになります。</p> <p>DateTime には「年」以外にも構成要素があります。<br /> 月、日、時刻、現地時間なのか UTC なのか、などです。<br /> これらの属性が組み合わせることで「現地時間 2000 年 4 月 1 日 12:00」の様な日時として更に意味のある概念を示せるようになります。</p> <p>この様に複数の属性で何かを説明したり意味のある概念を示すものが「概念的な統一体」です。</p> <h3 id="交換可能性"><a href="#%E4%BA%A4%E6%8F%9B%E5%8F%AF%E8%83%BD%E6%80%A7">交換可能性</a></h3> <p>DateTime は「不変」であるため、交換が不可能であると値を変更することが出来なくなってしまいます。<br /> その為 DateTime は交換可能でなければなりません。</p> <pre><code class="csharp"> // dateA に「2000 年 1 月 1 日」のインスタンスをセットしたあと 「2000 年 1 月 2 日」のインスタンスに「交換」する。 var dateA = new DateTime(2000, 1, 1); dateA = new DateTime(2000, 1, 2); </code></pre> <p>C# 的には当たり前のことかもしれませんが ValueObject として必要な要件です。</p> <h3 id="値の等価性"><a href="#%E5%80%A4%E3%81%AE%E7%AD%89%E4%BE%A1%E6%80%A7">値の等価性</a></h3> <p>C# において等価性について何も考慮されていないクラス/構造体では、内部で保持している値が同じだとしても異なるインスタンス同士は等価と判断されません。</p> <pre><code class="csharp"> // 参照型のクラス public sealed class User { public User(string id) { this.Id = id; } public string Id { get; } } public void Main() { var userA001 = new User("1234"); var userA002 = new User("1234"); // 同じ ID なので等価として判断して欲しい。 if(userA001 == userA002) { Console.WriteLine("同一ユーザー"); // しかし出力されない。 return; } Console.WriteLine("別ユーザー"); // 出力される。 } </code></pre> <p>ですが同じ値を保持しているのであればそれらのインスタンス同士を等価として判断して欲しい場面があります。<br /> C# にはそんな時の為に異なるインスタンス同士の等価性判断を提供する IEquatable インターフェースや == 演算子が用意されており、DateTime でもこれらが実装されています。</p> <pre><code class="csharp"> public static bool operator ==(DateTime d1, DateTime d2) => d1.InternalTicks == d2.InternalTicks; </code></pre> <p>引用 : <a target="_blank" rel="nofollow noopener" href="https://source.dot.net/#System.Private.CoreLib/DateTime.cs,df6b1eba7461813b">.NET Core Source Browser DateTime.cs</a></p> <p>これにより DateTime では異なるインスタンス同士を違和感なく等価かどうか判断出来るようになっています。</p> <pre><code class="csharp"> var dateA = new DateTime(2000, 1, 1); var dateB = new DateTime(2000, 1, 1); Assert.IsTrue(dateA == dateB); </code></pre> <p>この様に等価かどうかを判断出来ることが「値の等価性」です。</p> <h3 id="副作用のない振る舞い"><a href="#%E5%89%AF%E4%BD%9C%E7%94%A8%E3%81%AE%E3%81%AA%E3%81%84%E6%8C%AF%E3%82%8B%E8%88%9E%E3%81%84">副作用のない振る舞い</a></h3> <p>「副作用のない振る舞い」とは<code>何かを出力するけれども自身の状態は変更しないもの</code>です。<br /> 引用 : <a target="_blank" rel="nofollow noopener" href="https://www.amazon.co.jp/dp/B00UX9VJGW/ref=dp-kindle-redirect?_encoding=UTF8&btkr=1">ヴァーン・ヴァーノン. 実践ドメイン駆動設計</a></p> <p>「不変」の要件と異なるのは「何かを出力するけれども」という点です。<br /> DateTime がただ「不変」であるだけで良いのであれば AddDays メソッドや AddMonths メソッドは不要な筈です。<br /> 異なる日時のインスタンスは全てコンストラクタで生成すれば済むからです。</p> <p>しかし新しいインスタンスが欲しくなる度にコンストラクタを呼び出していてはコードが冗長になる上にバグを埋め込む可能性も高くなります。</p> <pre><code class="csharp"> var dateA = new DateTime(2000, 1, 31); // dateA の翌日が欲しかったが 31 日であることに気付かず日付に 1 を足してしまった。 var dateB = new DateTime(dateA.Year, dateA.Month, dateA.Day + 1); </code></pre> <p>こういったことを防ぐ為に DateTime では AddDays などのメソッドを提供しています。<br /> この様に『その概念に関する振る舞いをカプセル化して「不変」であることを保ちつつ何らかの値を返却する』ことが「副作用のない振る舞い」です。</p> <h2 id="DateTime は ValueObject"><a href="#DateTime+%E3%81%AF+ValueObject">DateTime は ValueObject</a></h2> <p>無事に DateTime で ValueObject の要件を全て説明することが出来ました。<br /> 同時に DateTime は ValueObject としての要件を満たしていることが分かりました。<br /> 「ValueObject 全然わからん」という方でも「つまり DateTime みたいなヤツだな」という理解が出来るようになったのではないでしょうか。</p> <h3 id="おまけ : ValueObject のポイント"><a href="#%E3%81%8A%E3%81%BE%E3%81%91+%3A+ValueObject+%E3%81%AE%E3%83%9D%E3%82%A4%E3%83%B3%E3%83%88">おまけ : ValueObject のポイント</a></h3> <p>ValueObject 6 個の要件は以下の様に 3 つのグループに分けることが出来ます。</p> <ul> <li>概念 <ul> <li>計測・定量化・説明</li> <li>概念的な統一体</li> </ul></li> <li>不変 <ul> <li>不変</li> <li>交換可能性</li> <li>副作用のない振る舞い</li> </ul></li> <li>等価性 <ul> <li>値の等価性</li> </ul></li> </ul> <p>概念グループの 2 つの要件は両方とも ValueObject で何らかの概念を定義する為の要件なので同じグループです。</p> <p>不変グループは ValueObject が「不変」であることが前提にあり、残りの 2 つは「不変」であるが故に生じる要件なので同じグループです。<br /> 「不変」であろうとすると自然に「交換可能性」と「副作用のない振る舞い」を満たす実装になります。</p> <p>等価性グループは「値の等価性」だけのグループです。</p> <p>自分で ValueObject を定義する際は「概念(のカプセル化)」、「不変」、「等価性」の 3 点を意識しておけば良いと思います。</p> kono 16 tag:crieit.net,2005:PublicArticle/16115 2020-10-06T00:33:41+09:00 2020-10-06T00:33:41+09:00 https://crieit.net/posts/NET-Core-HttpClient-AngleSharp-UTF-8 .NET Core + HttpClient + AngleSharp で UTF-8 ではないサイトをスクレイピングする <p>この記事は Qrunch からの移植記事です。<br /> 元記事は 2019/08/29 に書かれており、記事の内容が現状と即していない可能性が大いにあります。<br /> <a target="_blank" rel="nofollow noopener" href="https://nokoq16.qrunch.io/entries/YtBflMEtJiDnOak3">元記事</a></p> <p>以下から本文です。</p> <hr /> <p>タイトル通りなのですが、文字コード絡みで少しハマったので備忘がてら記事化しました。</p> <h2 id="事の経緯"><a href="#%E4%BA%8B%E3%81%AE%E7%B5%8C%E7%B7%AF">事の経緯</a></h2> <ol> <li>AngleSharp によるスクレイピングを試したくなる</li> <li>何気なしに 4Gamer.net さんのサイトで試す</li> <li>記事タイトルの取得を試みたところ盛大に文字化けしている</li> <li>なんでや!?</li> <li>charset で EUC-JP が指定されとるやんけ!</li> </ol> <p>という感じです。<br /> このご時世に初手で UTF-8 ではないサイトを引き当てるとは思いませんでした。</p> <h2 id="要点"><a href="#%E8%A6%81%E7%82%B9">要点</a></h2> <ul> <li>HttpClient.GetStreamAsync で Stream を取得して StreamReader で読み込む際に文字コードを指定する <ul> <li>HttpClient.GetStringAsync で string を取得したあと文字コード指定で Convert しようとしてもダメ</li> </ul></li> <li>.NET Core は素のままだと Shift_JIS や EUC-JP に対応していないのでエンコードプロバイダーを追加する <ul> <li><del>.NET Core あんまり触ってないから知らなかった</del></li> </ul></li> </ul> <h2 id="サンプルコード"><a href="#%E3%82%B5%E3%83%B3%E3%83%97%E3%83%AB%E3%82%B3%E3%83%BC%E3%83%89">サンプルコード</a></h2> <pre><code class="csharp">// .NET Core は素のままだと Shift_JIS や EUC-JP に対応していないのでエンコードプロバイダーを追加 Encoding.RegisterProvider(CodePagesEncodingProvider.Instance); // HttpClient でスクレイピングしたいサイトの HTML を取得する HttpClient httpClient = new ServiceCollection() .AddHttpClient() .BuildServiceProvider() .GetService<IHttpClientFactory>() .CreateClient(); Stream htmlStream = httpClient.GetStreamAsync("https://www.4gamer.net/").Result; string htmlString; using (var reader = new StreamReader(htmlStream, Encoding.GetEncoding("EUC-JP"), true) as TextReader) { htmlString = reader.ReadToEnd(); } // h2 > a > InnerText ≒ 記事タイトルを取得する var parser = new HtmlParser(); IHtmlDocument doc = parser.ParseDocument(htmlString); IHtmlCollection<IElement> h2Collection = doc.QuerySelectorAll("h2"); IEnumerable<string> articleTitles = h2Collection.Select(x => x.QuerySelector("a").InnerHtml); // 煮るなり焼くなり好きにする foreach (var articleTitle in articleTitles) { Trace.WriteLine(articleTitle); } </code></pre> <h2 id="参考記事"><a href="#%E5%8F%82%E8%80%83%E8%A8%98%E4%BA%8B">参考記事</a></h2> <p>AngleSharp を使うにあたり以下の記事を参考にしました。<br /> ありがとうございます。<br /> <a target="_blank" rel="nofollow noopener" href="https://qiita.com/Yuzu_Unity/items/48d00f2a4779f360d2de">Unity上でAngleSharpを利用したスクレイピングを行う</a><br /> <a target="_blank" rel="nofollow noopener" href="https://qiita.com/NekozeDaisensei/items/c74f71e5d79d6de05841">【C#】AngleSharpの使い方メモ</a></p> <h2 id="最後に"><a href="#%E6%9C%80%E5%BE%8C%E3%81%AB">最後に</a></h2> <p><del>4Gamer.net さん EUC-JP 止めて UTF-8 にして</del></p> kono 16 tag:crieit.net,2005:PublicArticle/16114 2020-10-06T00:09:31+09:00 2020-10-06T00:42:44+09:00 https://crieit.net/posts/youtube-dl youtube-dl でメンバー限定動画を保存する方法 <h1 id="結論"><a href="#%E7%B5%90%E8%AB%96">結論</a></h1> <ul> <li>--cookies オプションで Cookie ファイルを指定する。</li> <li>-u, --username と -p, --password オプションは <del>罠</del> 使わない。</li> </ul> <p>以上です。<br /> 以下から蛇足です。</p> <h2 id="手順"><a href="#%E6%89%8B%E9%A0%86">手順</a></h2> <ol> <li>チャンネルのメンバーになる <ul> <li>当然ですがダウンロードしたい動画のチャンネルメンバーになっていない場合はダウンロード出来ません。</li> </ul></li> <li>youtube の Cookie 情報を Netscape 形式のテキストファイルにする。 <ul> <li>Chrome の <a target="_blank" rel="nofollow noopener" href="https://chrome.google.com/webstore/detail/cookiestxt/njabckikapfpffapmjgojcnbfjonfjfg">cookies.txt</a> を使用すると楽です。 <ul> <li>DL したいチャンネルのメンバーになっているアカウントで youtube を開いて cookies.txt の内容を適当なファイルにコピペして適当な場所に保存して下さい。</li> </ul></li> <li><a target="_blank" rel="nofollow noopener" href="https://chrome.google.com/webstore/detail/editthiscookie/fngmhnnpilhplaeedifhccceomclgfbg">EditThisCookie</a> を使用している場合はエクスポートが JSON 形式になっているので Netscape 形式に変換して下さい。</li> </ul></li> <li>youtube-dl の --cookies オプションに先程保存した Cookie ファイルのパスを指定する。 <ul> <li>イメージ的にはこんな感じ ↓ です。最後の --cookies が肝です。</li> <li><code>youtube-dl --output outputPath --download-archive downloadArchivePath --write-thumbnail --add-metadata https://www.youtube.com/watch?v=xxxxxxxx -f "bestvideo[ext=mp4]+bestaudio[ext=m4a]/best[ext=mp4]/best" --ignore-errors --cookies cookieFilePath</code></li> </ul></li> <li>youtube-dl を実行する。</li> <li>DL 出来た!</li> <li>やったぜ!</li> </ol> <h2 id="参考"><a href="#%E5%8F%82%E8%80%83">参考</a></h2> <p>自分がメンバー限定動画を保存するにあたり、以下のページを参考にしました。<br /> ありがとうございました。<br /> <a target="_blank" rel="nofollow noopener" href="https://github.com/ytdl-org/youtube-dl/blob/master/README.md">youtube-dl / README.md</a><br /> <a target="_blank" rel="nofollow noopener" href="https://masayoshi-9a7ee.hatenablog.com/entry/20150905/1441414821">youtube-dl オプション一覧及びそのメモ</a><br /> <a target="_blank" rel="nofollow noopener" href="https://daveparrish.net/posts/2018-06-22-How-to-download-private-YouTube-videos-with-youtube-dl.html">HOW TO DOWNLOAD PRIVATE VIDEOS FROM YOUTUBE WITH YOUTUBE-DL</a></p> kono 16