投稿者 るきお  (社会人) 投稿日時 2011/4/13 20:57:11
情報はギブアンドテイクでお願いします。

>メールアドレスやリンクの抽出方法とかはWEBで探して方法は見つけたのですが、一つのページのHTMLにリンクが沢山ある場合があります。
その方法を載せてください。

回答する側も何も情報がないのと、とっかかりのプログラムがあるのとでは大違いです。

ご質問の件、試しに書いてみましたがこんなところでどうでしょうか?
Dim internet As New Net.WebClient
Dim html As String = internet.DownloadString("http://www.nifty.com/")
internet.Dispose()
Dim regop As System.Text.RegularExpressions.RegexOptions = System.Text.RegularExpressions.RegexOptions.IgnoreCase Or System.Text.RegularExpressions.RegexOptions.Singleline
Dim pattern As String = "\<a.*?(href=[""'](?<href>.*?)[""']).*?\>(?<InnerHtml>.*?)\</a.*?\>"
Dim regex As New System.Text.RegularExpressions.Regex(pattern, regop)

ListBox1.Items.Clear()

For Each match As System.Text.RegularExpressions.Match In regex.Matches(html)
    Dim href As String = match.Groups("href").Value
    Dim innerHtml As String = match.Groups("InnerHtml").Value

    ListBox1.Items.Add(href & " " & innerHtml)

Next


このプログラムはいろいろと考慮されていないことはありますが、多くのケースでAタグの情報を抜き出すことができます。
対象のサイトはutf-8で記述されていることが前提です。