2019-01-29に更新

chromedpで検索したNodeのHTMLを取得する

Go言語でヘッドレスChromeを利用できるライブラリであるchromedpにて、検索した要素のHTMLを取得するサンプルが全く見つからなかったのでメモ。

まずはクエリセレクタで要素リストを取得する。

    err := c.Run(ctxt, chromedp.Tasks{
        chromedp.Nodes(".some-class a", &nodes, chromedp.ByQueryAll),
    })

このnodesの下にある要素のHTMLを取得したかったのだが、cdp.NodeにはinnerHTML的なプロパティもメソッドもない。よくわからないがいろいろ調べたところ下記のような方法で取れた。

    var result string
    err := c.Run(ctxt, chromedp.Tasks{
        chromedp.ActionFunc(func(ctxt context.Context, h cdp.Executor) error {
            html, err := dom.GetOuterHTML().WithNodeID(node.NodeID).Do(ctxt, h)
            if err == nil {
                result = html
            }
            return err
        }),
    })

十分なリファレンスがほしい…。やっぱりquerySelector等がそのまま使えるNode.jsでのpuppeteer利用が最強っぽい気がする。


だら@Crieit開発者

Crieitの開発者です。 主にLAMPで開発しているWebエンジニアです(在宅)。大体10年程。 記事でわかりにくいところがあればDMで質問していただくか、案件発注してください。 業務依頼、同業種の方からのコンタクトなどお気軽にご連絡ください。 業務経験有:PHP, MySQL, Laravel5, CakePHP3, JavaScript, RoR 趣味:Elixir, Phoenix, Node, Nuxt, Express, Vue等色々

Crieitは個人で開発中です。 興味がある方は是非記事の投稿をお願いします! どんな軽い内容でも嬉しいです。
なぜCrieitを作ろうと思ったか

また、「こんな記事が読みたいけど見つからない!」という方は是非記事投稿リクエストボードへ!

こじんまりと作業ログやメモ、進捗を書き残しておきたい方はボード機能をご利用ください!

ボードとは?

関連記事

コメント