[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]
[jfriends] Re: UrlRetriever.java
ENDO Yasuyuki wrote:
>
> >ていました。HTMLファイルを読み込んだら、片っ端からURLの文字列を見つけて、
> >世界中のリンクを辿り続けるものでした。パケットの無駄遣いとはまさにこの事で
> >す。(^^;
>
> なかなか凶悪なコードですね。^^;
> かなりの時間がかかるのではないでしょうか?
はは。検索エンジンに使えませんかね?(冗談)
ただ、URLの重複チェックに時間がかかりますね。
時間が経つにつれて、ひたすら重複チェックだけに精を出す始末。
> ただし私がやった例では、例えば <FRAME SRC=./main.htm などという
> " 記号が無い凶悪なものがあり、Netscape などのブラウザーでは
> 表示できてしまうので厄介でした。
> MagicMapper も " 記号が無いタグの解析は失敗していました。
>
> これが自分で書こうと思った動機です。
あー、そんなのあるんですか。分かりませんでした。
結局 1文字ずつ処理することになるのか...
------------
高橋智宏