ラベル「HTML」の付いた投稿を表示しています。

HTMLを簡易に解析(tokenize / parse)する

目次 はじめに DOMParser を使用する HTMLから文字列を抽出する 正規表現を使用して、簡易にタグとタグ以外を分解する 正規表現を使用して、もう少し考えて分解する HTMLのドキュメントツリーを簡易に作成する はじめに JavaScript で HTML を簡易に解析(...

robots.txt でクローラを全拒否する

巡回を全拒否する robots.txt User-agent: * Disallow: / 説明 User-agent: * すべてのクローラを対象にする。 Disallow: / ルート配下の全ディレクトリを対象にする。 備考:失敗例 robots.txt User-agent...

HTMLパース処理を中断して強制初回描画する

サイトの高速化について試行錯誤していたら、面白そうな現象を発見したので覚書です。 なにをするのか? ページがヘッダー部・コンテンツ部・フッター部に分割されているものとします。この時、「ヘッダー部のみをコンテンツ部・フッター部のHTMLパース処理を待たずに表示する」です。意図せずに...