请问nutch或者heritrix能对需登陆后的页面进行抓取么
illu
2010-11-02
也就是说当登陆后 需要得到此步的cookie 在抓取登陆后的页面时 是需要此cookie支持才能抓到的 nutch和heritrix能做到这点么 请大家指教
或者 如果做不到 又有没有别的开源类库可以实现? |
illu
2010-11-02
也就是说当登陆后 需要得到此步的cookie 在抓取登陆后的页面时 是需要此cookie支持才能抓到的 nutch和heritrix能做到这点么 请大家指教
或者 如果做不到 又有没有别的开源类库可以实现? |