i&#39;ve used beautiful soup in python and i&#39;ve done some regex-fu too let me know what you need and i can help out!<br clear="all"><br>nick<br><br>
<br><br><div class="gmail_quote">On Sat, Mar 3, 2012 at 5:49 PM, Liz Henry <span dir="ltr">&lt;<a href="mailto:liz@bookmaniac.org">liz@bookmaniac.org</a>&gt;</span> wrote:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">

Take a look at ScraperWiki - it might be useful!<br>
<br>
- liz<br>
<div class="HOEnZb"><div class="h5"><br>
On 3/3/12 11:43 AM, Ben Kochie wrote:<br>
&gt; I&#39;ve spent some time digging around for open source tools for<br>
&gt; accessing PG&amp;E data.  It looks like there is no API or anything useful<br>
&gt; for getting access to the data.  We&#39;ll have to write a web scraper to<br>
&gt; pull the data.  Since this isn&#39;t something I&#39;m good at, I&#39;m looking<br>
&gt; for some help.  From what I can tell it shouldn&#39;t be terribly hard to<br>
&gt; grab the data we need and then feed it into a database.<br>
&gt; _______________________________________________<br>
&gt; Noisebridge-discuss mailing list<br>
&gt; <a href="mailto:Noisebridge-discuss@lists.noisebridge.net">Noisebridge-discuss@lists.noisebridge.net</a><br>
&gt; <a href="https://www.noisebridge.net/mailman/listinfo/noisebridge-discuss" target="_blank">https://www.noisebridge.net/mailman/listinfo/noisebridge-discuss</a><br>
&gt;<br>
<br>
<br>
</div></div><span class="HOEnZb"><font color="#888888">--<br>
<br>
------------------------<br>
Liz Henry<br>
<a href="mailto:liz@bookmaniac.org">liz@bookmaniac.org</a><br>
<a href="http://bookmaniac.org" target="_blank">http://bookmaniac.org</a><br>
<br>
&quot;Without models, it&#39;s hard to work; without a context, difficult to<br>
evaluate; without peers, nearly impossible to speak.&quot; -- Joanna Russ<br>
</font></span><div class="HOEnZb"><div class="h5">_______________________________________________<br>
Noisebridge-discuss mailing list<br>
<a href="mailto:Noisebridge-discuss@lists.noisebridge.net">Noisebridge-discuss@lists.noisebridge.net</a><br>
<a href="https://www.noisebridge.net/mailman/listinfo/noisebridge-discuss" target="_blank">https://www.noisebridge.net/mailman/listinfo/noisebridge-discuss</a><br>
</div></div></blockquote></div><br>