Octoparse (オクトパース)でスクレイピングをしよう!使い方を徹底解説!

こちらの記事では、スクレイピングツールOctoparse(オクトパース)について解説しています。

スクレイピングツールOctoparse(オクトパース)の使い方・評判・安全性・その他詳しく解説していますので、参考にしてください。

 

合わせて読みたい

スクレイピングツールOctoparse(オクトパース)とは?

画像出典:Software Testing Help

Octoparseとは、プログラミングが不要でWebスクレイピングが行えるスクレイピングツールです。

従来、スクレイピングを行うためには、PythonやRubyなどのプログラミングを用いる必要がありましたが、Octoparseなどの、スクレイピングツールを利用することで、手軽にスクレイピングが行えます。

スクレイピングとは、データを収集し利用しやすく加工することです。

また、Web上からデータを取得することをWebスクレイピングといいます。

ツールやプログラミングでスクレイピングを自動化することで、手間・時間を大幅に省略することができます。

ツールサービスを利用する方法

自身でプログラミングをする方法

スクレイピングには、「Python」が多く用いられます。

 

 

Octparseでできること・メリット

Octparseでできること・メリットとして以下の点が挙げられます。

  • 簡単にスクレイピングが可能
  • Webスクレイピングテンプレートを利用できる
  • 様々な種類のサイトに対応している
  • クラウド上にデータを保存できる
  • 自動的にIPをローテーションできる
  • 出力方法が豊富
  • データの取得スケジュールを設定できる
  • 取得ページの制限がない
  • 日本語に対応している
  • API申請が不要
  • サポートが充実している

それぞれ解説します。

 

簡単にスクレイピングが可能

Octoparseには最先端の機械学習のアルゴリズムが搭載されています。

そのおかげで、データの正しい位置を認識し、クリックしたらすぐにスクレイピングを開始することができます。

 

テンプレートを利用できる

Octoparseには、数十種類のスクレイピングテンプレートがあり、それらにパラメータを入力することで即座にデータを抽出することができます。

テンプレート例

  • Yahooショッピング
  • メルカリ
  • 楽天市場
  • マイナビ転職
  • リクナビnext
  • ヤフオク
  • ZOZOTOWN
  • 食べログ
  • iタウンページ
  • Googleマップ
  • SUUMO

 

様々な種類のサイトに対応している

Octoparseは、静的なWebサイトだけでなく、AJAXやJavaScriptなどの動的なWebサイトにも対応しています。

ExcelやCSVは勿論、HTMLなどのデータも抽出することができます。

 

クラウド上にデータを保存できる

Octoparseで取得した情報は、自動的にクラウド上に保存されます。

そのため、いつでも取得したデータにアクセスすることができます。

 

自動的にIPをローテーションできる

Octoparseのクラウドサービスのクラウドサーバーは数百台あり、それぞれ異なるIPアドレスを保有しているため、自動的にIPローテーションをすることができます。

通常、クラウドを利用してデータの取得をする場合、対象サイトに対して同じIPでアクセスすると、追跡されたり、アクセスを拒否されたりする恐れがありますが、Octoparseを利用することでそのような心配はありません。

 

出力方法が豊富

Octoparseは、取得したデータの出力方法が、Excel・CSV・HTML・JSON・MySQL・Oracleなどと豊富です。

 

データの取得スケジュールを設定できる

Octoparseは、時間を指定してデータを取得する設定ができます。

決まった時間に定期的にデータを更新したい場合などに便利な機能です。

 

取得ページの制限がない

Octoparseは、無料・有料プランに関係なく取得ページの制限がありません。

試しにOctoparseを利用したい方などは、無料プランから始めることをおすすめします。

*無料プランは有料プランと比較してデータの取得速度が遅くなります。

 

日本語に対応している

Octoparseは、海外製品ですが2018年6月1日から日本語でのサービスを開始しました。

日本語でのサポートも充実しており、英語に不慣れな方でも安心して利用できます。

 

API申請が不要

Pythonを利用してスクレイピングを行う場合、API申請が必要ですが、Octoparseを利用することでAPI申請が不要になります。

 

サポートが充実している

Octoparseは、有料プランを契約することで電話・メール・skypeでのサポートを受けることができます。

Octoparseを利用する際に、わからないことがあっても安心です。

また、無料プランでもコミュニティに参加することができ、他のユーザーに質問をすることで、疑問を解決できます。

 

 

Octoparseの使い方を解説!

Octparseの使い方を解説します。

以下の手順を参考に実際にOctparseを使ってみてください。

 

【事前知識】Octparseのスクレイピングは違法?規約について

Octparseを利用する前に、Octparseのスクレイピングの規約や違法性について解説します。

WebスクレイピングとWebクローリングそのものは違法ではなく、データ分析を目的とし、新たに自社のデータベースとして活用する場合は違法とはなりません。しかし、著作権を侵害したり、スクレイピングを行うWebサイトの規約に違反すると違法とみなされ、法的措置をとられる可能性があります。調査によると、Webスクレイピングによるコンテンツの悪用により、オンライン収益の2%が失われる可能性があります。

Webスクレイピングには、その適用に対処するための明確な法律や用語がありませんが、スクレイピングを行う際に気を付けなければ違法になってしまう場合が3つあります。

  • 利用規約に違反する
  • サーバに過度の負荷をかける
  • 著作権を侵害する

Webスクレイピングは、Webデータ抽出とも呼ばれ、基本的には、ハイパーテキスト転送プロトコル(HTTP)またはWebブラウザを介してWeb上で利用可能なデータを取得することを指します。今のデジタル世界ではWebスクレイピングが不可欠なスキルになったと言えるでしょう。この技術を使えば、簡単にWebサイトから情報を自動で取得できるので、アッという間に解決することが可能です。業務上、大幅な工数削減に役立つなど重宝します。

引用:Octparseによるスクレイピングは違法ですか?>>

データ分析の目的のためなら違法にならないようです。

しかし、著作権や利用規約を違反する場合などは、法的処置を取られる可能性がありますので、注意してください。

利用規約|スクレイピングツール&Webクローラー>>

 

登録

Octparseの登録方法を解説します。

まだ、Octparseに登録していない方は以下の手順を参考に登録を行ってください。

STEP.1

Octoparseの公式サイトにアクセス

STEP.2
「ダウンロード」をクリック。

STEP.3

今回は、Windows版を例に解説します。

STEP.4
ダウンロードしたファイルを解凍する。

STEP.5
「アカウント作成】をクリック。

STEP.6
画像の項目を入力。

  • メールアドレス
  • ユーザー名
  • パスワード
  • パスワード再入力
  • 業種の選択

入力後、「登録する」をクリックしてください。

STEP.7
認証メールが届くので確認する。

STEP.8
プランを選択。

STEP.9
ログインして完了。

 

スクレイピングをする

以下の手順を参考にスクレイピングを行ってください。

STEP.1
スクレイピングしたいサイトのURLを入力。

入力後、「抽出開始」を入力してください。

STEP.2
「ワークフローを生成」をクリック。

STEP.3
「保存して実行する」をクリック。

STEP.4
抽出方法を選択。

フリープランでは、ローカル抽出のみとなります。

ローカル抽出は、使用しているコンピューターの性能とネットワークの速度によって大きく抽出速度が異なります。

クラウド抽出は、複数のサーバーのクラウド内で実行されるので、ローカル抽出と比較して約6倍から20倍の速さでデータの抽出を行えます。

STEP.5
エクスポート方法を選択。

  • Excel
  • CSV
  • HTML
  • JSON

今回は、CSVを選択します。

STEP.6
抽出したデータをエクスポートして完了。

 

複数ページからスクレイピングをする方法

Octparseで複数のページからスクレイピングをする方法は、以下の2通りの方法があります。

  • URLのリストで新しいタスクを作る
  • ワークフローデザイナで「URLリスト」ループを作る。

今回は、ワークフローデザイナで「URLリスト」ループを作る方法を解説します。

STEP.1
新規作成から「カスタマイズタスク」を選択。

STEP.2
URLを入力。

入力後、「保存」をクリックしてください。

STEP.3
ワークフローで「URLリスト」ループを作る。

STEP.4
ループが作成されたら、Webページ上のデータを抽出する。

詳細な解説につきましては、以下のサイトを参考にしてください。

複数のWebページ(URL)からデータを抽出する

 

Amazonの情報をスクレイピングする方法

Octparseを利用して、Amazonの情報をスクレイピングする方法につきましては、以下の記事を参考にしてください。

Amazonから製品情報をスクレイピングする>>

 

 

Octoparseの評判は?

Octparseの評判はどうなのでしょうか?Twitterを例に解説します。

 

Octparse、最初使い方よーわからんでめっちゃ重くなってたけど、一度設定できたらこんな楽なことないな

— ばね(SpringFF) (@SpringFF2) October 21, 2020

最初は難しいと感じることもあるようですが、設定後は簡単に扱えるようです。

 

Octparseが想像以上に凄すぎて、スクレイピングコード書くのはバカバカしくなってきた

こんなイケてるツールあるなら速く教えてほしかったわhttps://t.co/EEE5ybUNfy

— ozeki@エンジニア (@tagaranoko1014) January 7, 2021

スクレイピングのためにコードが不要なので、好評ですね。

 

オクトパースを使えば、ノンプログラマーな僕でもスクレイピングし放題なことに気づいた。

無料で1万URLクロールできるのでプライベートで使うならお金かからない。ただし、無料版はクロールスピードが遅いです。仕事で使うなら有料版のほうが良さそう。https://t.co/ycyYicaRNA

— 酒井 亮平 (@sakai_ryohei) June 3, 2019

プログラミングの知識がない方でもスクレイピングが簡単にできる点が好評ですね。

しかし、無料版だとクロールの速度が遅いため、仕事で利用する場合は有料版がおすすめのようですね。

 

無料版だとクロールの速度が遅いというデメリットもありましたが、良い評判が圧倒的に多かったです。

Octparseは、無料から利用することができますので、興味のある方は実際に利用してみることをおすすめします。

 

 

Octoparseの安全性・ウイルス対策は?

Octparseを利用していると、コンピュータ上のセキュリティ対策ソフトウェアによって、ウイルスとして誤って報告されることがありますが、

私たちOctoparseチームは、Octoparseのインストールファイルにウイルスがないことを保証します。マルウェアの検出は、Octoparseの防御メカニズムがセキュリティ対策ソフトウェアによって識別されていないからです。

引用:Octparseヘルプ

上記のように公式によって、名言されていますのでご安心ください。

ウイルスとして認識されると、以下のような影響が出ることがあります。

  • Octparseを起動したら数分で閉じる
  • ローカル抽出でタスクを実行すると動かない
  • 使用期限切れとエラーが表示され、Octparseを利用できない。

セキュリティ対策ソフトウェアでホワイトリストを作成した後にOctparseを再インストールすることで解決できます。

 

Octoparseに関するよくある質問

  • Octoparse(オクトパース)の料金は?無料版はある?
  • Octoparse(オクトパース)のapiについて
  • Octoparse(オクトパース)にログインできない
  • Octoparse(オクトパース)の対応環境は?
  • Octoparse(オクトパース)Mac

それぞれ解説します。

 

Octoparseの料金は?無料版はある?

プラン フリー スタンダード プロフェッショナル エンタープライズ
料金/月 0$ 89$ 249$ 問い合わせ
料金/年 0$ 75$ 209$ 問い合わせ
無料トライル 14日間 14日間 30日間
取得ページ数 無制限 無制限 無制限 ▶機能

    • プロフェッショナルまでの全機能
    • 作れるタスク数+750
    • クラウドサーバー数+40
    • 複数アカウント機能あり
    • Webコンソールで管理できる

▶データサービス

Webクローラーの制作代行、データ取得代行のサービスの提供。

お見積り

インストール台数 無制限 無制限 無制限
データエクスポート回数 10,000レコード/回 無制限 無制限
並行ローカルタスク数 2 無制限 無制限
作れるタスク数 10 100 250
クラウドサーバー数 6 20
定期実行可能
自動IPローテーション
タスクテンプレート
APIアクセス
Advanced APIアクセス
タスクチェック無料
おすすめな方 試してみたい方 個人で活用したい方 小規模の企業や組織 管理機能まで活用したい企業
利用可能お支払い方法
    • PayPal
    • Visa
    • DISCOVER
    • Master Card
    • Amerikan Express
    • diners-club
    • JCB

引用:料金プラン

無料プランでも取得ページ数・インストールできるパソコン台数が無制限ですので、Webスクレイピングを始めたいという方は、無料プランから始めることをおすすめします。

また、全ての料金プランにおいて、5日間の返金保証ある点も安心です。

割引サービス

  • 教育機関
  • ジャーナリズム
  • 非営利団体

お申込み:https://helpcenter.octoparse.jp/

 

Octoparse APIについて

OctoparseではOpen APIを提供しています。

Open APIを利用することで、クライアントを操作することなく、抽出データ(クラウド抽出データのみ)やタスク情報を取得・制御することができるほか、ユーザー独自のアプリケーションとのシームレスなデータ連携が可能です。

また、Octoparseを使ってスクレイピングした大量データをCRMやデータ可視化ツールに統合し、顧客分析やデータの視覚化をスムーズに行うこともできます。

データドリブンなビジネスが重要とされている現代において、Octoparse APIがビジネスにもたらす影響は計り知れません。

Octoparse APIで手に入るのは単なるデータではなく、競合優位性や新しい付加価値を確立するための手段なのです。

*Open APIを利用する場合、Octoparseのスタンダードプラン、またはプロフェッショナルプランの契約が条件となります。

 

Octoparseにログインできない

Octoparseへのログインは、以下のURLから行ってください。

https://www.octoparse.jp/Login

Octparseまだ登録していない方は、以下のURLから登録をしてください。

https://www.octoparse.jp/SignUp

 

Octparseの対応環境は?

Octparseは、WindowsとMacに対応しています。

  • Windows(XP、7、8、10)
  • Mac

 

Macへのインストール方法

MacにOctparseをインストールする方法につきましては、以下のサイトを参考にしてください。

Macにインストールする方法>>

 

スクレイピングツールOctoparse|まとめ

画像出典:Software Testing Help

スクレイピングツールOctparseについて解説しましたが、参考になったでしょうか?

Octparseなどのスクレイピングツールを利用することで誰でも簡単にスクレイピングを行うことができます。

Octparseは、無料のプランもあり、有料プランであっても14日間の無料トライアルがありますので、興味のある方は実際に利用してみることをおすすめします。

最後まで読んで頂きありがとうございました。