正規表現を使っての文字列の抽出方法への返答

投稿で使用できる特殊コードの説明。(別タブで開きます。)

お名前

本名は入力しないようにしましょう。

削除パスワード

投稿した後で削除するときに使うパスワードです。返答があった後は削除できません。

社会的身分

返答する人が目安にします。相手が小学生か社会人かで返答の仕方も変わります。

解決

解決時にチェックしてください。

最初の投稿が質問の場合、質問者が解決時にチェックしてください。(以降も追加書き込み・返信は可能です。)

本文

※「過去ログ」について書くときはその過去ログのURLも書いてください。

以下の返答は逆順(新しい順)に並んでいます。

投稿者葉月 (社会人) 投稿日時 2010/5/2 19:14:25

どういったケースを想定しているかにより回答が変わってきます。
サンプルのように決められたソース(サイトと言い換えることもできます)を
摘出するなら正規表現を使うより、決められたタグだけを抜き出すように作
った方がいいです。
複数のパターンがあるなら、パターンごとに自作メソッド、またはクラスご
とに作って対応します。
無数のパターンがあり、それでは効率が悪いなら正規表現を考えます。

詳しくは、こちらを参考にしてください。
http://rucio.cloudapp.net/ThreadDetail.aspx?ThreadId=9457
http://rucio.cloudapp.net/ThreadDetail.aspx?ThreadId=141

＞＞＞「""」があると上手くいかないようです。
私も似たケースでエスケープ文字を処理するときに、イラっときます。
String.Replaceメソッドなどで処理がうまくできません。
しょうがないので、力技でごまかします。

＞イメージ(コンパイル通らないと思います)

' 末尾の\と半角が邪魔 

Dim str As String = "http://test.com/1024\" "

str = str.Substring(0, str.Length-2)

投稿者 (削除されました) () 投稿日時 2010/2/23 07:57:37

(削除されました)

投稿者 クロネコ (社会人) 投稿日時 2010/2/22 07:38:06

正規表現を使って、HTML内の「HTML内の文字を抽出する」や「VBnetで Webbrowserコントロール」を抽出したいと思っているのですが、上手くいきません。

ヴィッウィーンするときに、「""」があると上手くいかないようです。

このような場合、何か方法はあるのでしょうか？

<TD[^<]*</TD>　'○出来ます 



<h2 class="Title"[^<]*</Div>　'×出来ません

html-------------------------------------------

<h2 class="Title">HTML内の文字を抽出する</h2>
<div class="NewsBody">VBnetで Webbrowserコントロール</div>

html-------------------------------------------

正規表現を使っての文字列の抽出方法 への返答

正規表現を使っての文字列の抽出方法への返答