tag:crieit.net,2005:https://crieit.net/tags/%E8%AA%8D%E8%AD%98/feed 「認識」の記事 - Crieit Crieitでタグ「認識」に投稿された最近の記事 2020-04-23T15:43:49+09:00 https://crieit.net/tags/%E8%AA%8D%E8%AD%98/feed tag:crieit.net,2005:PublicArticle/15864 2020-04-23T15:43:49+09:00 2020-04-23T15:43:49+09:00 https://crieit.net/posts/Octoparse-8-1-Beta スクレイピング業界の変革|Octoparse 新バージョン 8.1 Beta がリリース! <p><a href="https://crieit.now.sh/upload_images/83fd1e8a036ec55de62793094109faa55ea1386632f82.png" target="_blank" rel="nofollow noopener"><img src="https://crieit.now.sh/upload_images/83fd1e8a036ec55de62793094109faa55ea1386632f82.png?mw=700" alt="image" /></a></p> <p>Webスクレイピングツールである<a target="_blank" rel="nofollow noopener" href="https://www.octoparse.jp/">Octoparse</a>の新バージョン ver 8.1 (ダウンロードは<a target="_blank" rel="nofollow noopener" href="https://www.octoparse.jp/Download">こちら</a>)が2020年4月15日よりリリースされました。今回の新バージョンのリリースでは、、Webページの自動認識機能の追加と内蔵ブラウザのアップグレードにより、パフォーマンスが向上し、データ取得の効率を大幅に改善しました。 また、ユーザインターフェースの改善により、インストールからタスク作成、実行中の操作まで、使いやすさも向上しました。</p> <p>今回の主なバージョンアップ項目は以下のようになります。</p> <h1 id="1.ハンズフリーでデータ抽出が可能"><a href="#1.%E3%83%8F%E3%83%B3%E3%82%BA%E3%83%95%E3%83%AA%E3%83%BC%E3%81%A7%E3%83%87%E3%83%BC%E3%82%BF%E6%8A%BD%E5%87%BA%E3%81%8C%E5%8F%AF%E8%83%BD">1.ハンズフリーでデータ抽出が可能</a></h1> <p>「Webページの自動認識」機能を追加するにより、WebページのURLアドレスを入力するだけで、Octoparseは自動的にWebページを識別し、ワークフローを自動的に生成するようになります。Webページ上のテキスト、画像、リンクなどの情報を識別でき、収集するデータフィールド、ページネーション、スクロールダウンなどの設定を自動的に推奨できます。複数の認識結果が表示され、簡単に切り替えられ、一般的なニーズを満たすことができると思われます。超初心者でも手軽にデータをスクレイピングできるようになりました!</p> <h1 id="2.高度なブラウザ互換性"><a href="#2.%E9%AB%98%E5%BA%A6%E3%81%AA%E3%83%96%E3%83%A9%E3%82%A6%E3%82%B6%E4%BA%92%E6%8F%9B%E6%80%A7">2.高度なブラウザ互換性</a></h1> <p>内蔵ブラウザをFirefoxからGoogle Chromeに切り替えました。以前のバージョンで読み込めなかったWebサイトは、Octoparse 8.1ですぐに読み込めるようになります。あらゆるWebサイトがOctoparseの内蔵ブラウザに開けられるように努めています。</p> <h1 id="3.より高速なスクレイピング速度"><a href="#3.%E3%82%88%E3%82%8A%E9%AB%98%E9%80%9F%E3%81%AA%E3%82%B9%E3%82%AF%E3%83%AC%E3%82%A4%E3%83%94%E3%83%B3%E3%82%B0%E9%80%9F%E5%BA%A6">3.より高速なスクレイピング速度</a></h1> <p>Webデータ収集のプロセスにおいて、更なる高速化が求められています。スクレイピング速度も、高品質のスクレイピングツールのコア競争力です。以前のバージョンと比べて、Octoparse 8.1は、10倍高速で応答性が向上しています。OP 7.0が100件データを抽出するのに21分41秒かかりましたが、OP 8.1が同じWebページから同じ量のデータを取得するのに2分しかかかりませんでした。</p> <h1 id="まとめ"><a href="#%E3%81%BE%E3%81%A8%E3%82%81">まとめ</a></h1> <p>新バージョンに関する詳細はこの記事をご覧ください。Octoparseへのご意見、アドバイスなどがございましたら、ぜひご遠慮なくお寄せください。Octoparseは引き続きより良いサービス・機能を提供できるよう努めております。</p> <p>元記事:<a target="_blank" rel="nofollow noopener" href="https://www.octoparse.jp/blog/octoparse-81-release-features/">スクレイピング業界の変革|Octoparse 新バージョン 8.1 Beta がリリース!</a></p> Octoparse Japan