<div class="gmail_quote">On Sun, May 13, 2012 at 11:41 PM, Ryan Rawson <span dir="ltr">&lt;<a href="mailto:ryanobjc@gmail.com" target="_blank">ryanobjc@gmail.com</a>&gt;</span> wrote:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">

wget --username=&lt;username&gt; --password=&lt;password&gt; -r -np  &lt;URL&gt;<br>
<br></blockquote><div><br></div><div>Isn&#39;t that username/password thing for Basic Authentication only? And it&#39;s &quot;--user&quot; not &quot;--username&quot;. I fiddled with wget for 1/2 an hour, getting stuck on usernames, and trying to log in to their https server. No dice.</div>

<div><br></div><div>--------------------------------------------------</div><div><br></div><div>John Adams wrote about &quot;<span style>wget -mk </span><a href="http://foo.com/" target="_blank" style>http://foo.com</a>&quot;</div>
<div>The wget manual has no mention of a &quot;-mk&quot; option. Can you tell me what else I might look for?</div><div><br></div><div>--------------------------------------------------</div><div><br></div><div><div>Rigel writes: </div>
<div><span style>&gt;23andme does not sequence your genome</span><br style><font color="#222222" face="arial, sans-serif"></font><span style>...</span></div><div><span style>&gt;it is, IMHO (as a former biology bench-researcher), kind of a scam</span></div>
<div><span style><br></span></div><div><span style>Yes yes. You are very smart.</span></div></div><div><br></div><div>--------------------------------------------------</div><div><br></div><div><br></div><div>David Roxex wrote about <a href="http://www.charlesproxy.com/" target="_blank" style>http://www.charlesproxy.com/</a></div>
<div>It looks peachy, now I just want to tell charlesproxy to crawl  the site... and then it&#39;d be super if I could figure out how to, you know, use it. It&#39;s very powerful. Very. I want to do one thing and I&#39;ve become impatient in my old age. :-(</div>
<div><br></div><div><br></div><div><br></div><div><br></div><div> </div><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">
be careful, sometimes auto-generated sites can produce endless loops<br>
of content that confuses wget.<br>
<br>
If things get hairy, put:<br>
-l &lt;number&gt;<br>
<br>
to limit how &#39;deep&#39; the get should follow links.<br>
<br>
enjoy<br>
<div><div><br>
On Sun, May 13, 2012 at 11:33 PM, Lee Sonko &lt;<a href="mailto:lee@lee.org" target="_blank">lee@lee.org</a>&gt; wrote:<br>
&gt; I&#39;m trying to make an archive of a website subscription I belong to,<br>
&gt; my <a href="http://23andme.com" target="_blank">23andme.com</a> account. I can&#39;t find a tool that will download this website.<br>
&gt; I&#39;d rather not copy-and-paste 300 pages. I tried WinHTTrack. Maybe WGet<br>
&gt; excels at this but it&#39;s a steep learning curve; it&#39;d be nice if someone<br>
&gt; point me in the direction of a tool that could do it.<br>
&gt;<br>
&gt; I can see two obvious hurdles. Logging in might be designed to be an<br>
&gt; interactive process (I tried dragging cookies around in WinHTrack to no<br>
&gt; avail). And maybe so much depends on the server on a modern website that it<br>
&gt; might not be possible to have a web page without a server. What say the<br>
&gt; Noisy-nerds?<br>
&gt;<br>
&gt; Lee<br>
&gt;<br>
&gt;<br>
&gt;<br>
&gt;<br>
</div></div>&gt; _______________________________________________<br>
&gt; Noisebridge-discuss mailing list<br>
&gt; <a href="mailto:Noisebridge-discuss@lists.noisebridge.net" target="_blank">Noisebridge-discuss@lists.noisebridge.net</a><br>
&gt; <a href="https://www.noisebridge.net/mailman/listinfo/noisebridge-discuss" target="_blank">https://www.noisebridge.net/mailman/listinfo/noisebridge-discuss</a><br>
&gt;<br>
</blockquote></div><br>