Warning: error_log(/data/www/wwwroot/hmttv.cn/caches/error_log.php): failed to open stream: Permission denied in /data/www/wwwroot/hmttv.cn/phpcms/libs/functions/global.func.php on line 537 Warning: error_log(/data/www/wwwroot/hmttv.cn/caches/error_log.php): failed to open stream: Permission denied in /data/www/wwwroot/hmttv.cn/phpcms/libs/functions/global.func.php on line 537
起政府網(wǎng)站,相信很多人想到的是這樣:
要不就是這樣:
也有可能是這樣:
nonono,你們對政府網(wǎng)站偏見太深了,其實(shí)很多政府網(wǎng)站能給你辦很多事情的!比如網(wǎng)絡(luò)運(yùn)營商提供的網(wǎng)絡(luò)有問題,比如快遞丟件,比如查詢是不是買到了假貨……這些功能都很好很強(qiáng)大,大家趕緊分享收藏起來,以后總用得上??!
1、國家食品藥品監(jiān)督管理總局
網(wǎng)址:http://www.sda.gov.cn/WS01/CL0001/
大家注意,政府機(jī)構(gòu)的域名結(jié)尾通常是“.gov” 或者“.gov.cn”其他很可能是釣魚網(wǎng)站!打開網(wǎng)址我們可以看到這樣一個頁面,因?yàn)樽筮叺牟糠謳缀蹩梢月匀ゲ挥茫孕【幗o它打了個“小馬”。重點(diǎn)是右邊的這排!寫著“食品”、“藥品”以及“化妝品”等。這些就是食藥監(jiān)督局的業(yè)務(wù)范圍。比如小編想查的是化妝品,所以直接點(diǎn)化妝品進(jìn)去看看。
點(diǎn)開來后,就是一個超簡單直觀的查詢頁面,只要知道產(chǎn)品品牌名稱就能查,進(jìn)口和國產(chǎn)都能查。小編輸入一個比較常用的品牌,查出滿滿當(dāng)當(dāng)?shù)馁Y料。
然后,樓主輸入一個在朋友圈賣的很火的,號稱國外原裝進(jìn)口的化妝品。沒有!根本沒有這個東西!只要是經(jīng)海關(guān)進(jìn)口的化妝品/食品,食藥監(jiān)督局是一定查得到的!如果米有,那就是假洋品牌。
2、國家郵政局投訴網(wǎng)站
網(wǎng)址:http://sswz.chinapost.gov.cn/
這個網(wǎng)站比上面那個更實(shí)用,上面那個只能查詢,這個可以投訴?。”热纾愕哪硞€很重要的快遞被快遞公司弄丟了,快遞公司不肯承擔(dān)責(zé)任不處理此事。那么這時候登陸國家郵政局的投訴網(wǎng)站就有效了。有網(wǎng)友說,投訴第二天快遞就打來電話,還是省區(qū)經(jīng)理親自致電,一個勁兒的道歉,態(tài)度180度轉(zhuǎn)彎,馬上賠償。并且反復(fù)交代,如果郵政回訪,請一定要說問題解決了!
注意,郵政投訴有個條件,就是你已經(jīng)與快遞公司溝通,溝通不成,才能投訴。
3、各地工商局網(wǎng)站
湖南省工商行政管理局網(wǎng)址:http://www.hnaic.gov.cn/
有網(wǎng)友的弟弟畢業(yè)后,被一個公司叫去面試,過了,但弟弟覺得是傳銷。那家公司堅(jiān)決說自己是跨國大企業(yè),國內(nèi)總部在浙江某市,中外合資。于是弟弟去了當(dāng)?shù)毓ど叹志W(wǎng)站。輸入那家企業(yè)的名字后,立刻有了結(jié)果。企業(yè)是存在的,也是注冊的,但是大型跨國企業(yè)……注冊資金39w美刀,人民幣240萬!你說你是跨國大企業(yè)!誰信?。∧鼙怀蔀榭鐕笃髽I(yè)的,注冊資金至少1000萬美元??!
4、學(xué)信網(wǎng)
網(wǎng)址:http://www.chsi.com.cn/
這個很多大學(xué)生應(yīng)該知道?,F(xiàn)在是填報(bào)志愿的時候,很多“垃圾”學(xué)??鋸埿麄鳎f不要分?jǐn)?shù),都能上,還能拿到國家承認(rèn)文憑等等,結(jié)果最后就讀之后查不到自己的學(xué)籍。這個網(wǎng)站不含自考的學(xué)籍,所以,如果查不到的話,極有可能就是自考生。簡單說,這個所謂大學(xué),就是個自考培訓(xùn)機(jī)構(gòu)!此外這個網(wǎng)站還能查詢學(xué)歷,對用人單位是個很好的辦法,電線桿辦證再也不會蒙蔽人了! 還有一個用法,大家如果去相親……對方吹噓自己高學(xué)歷神馬的……但你又有懷疑,那就想辦法要到他的學(xué)歷證書,然后上學(xué)信網(wǎng)查之。……
5、衛(wèi)生和計(jì)劃生育委員會的執(zhí)業(yè)醫(yī)師查詢
網(wǎng)址:http://61.49.18.120/doctorsearch.aspx
比如你要查某位醫(yī)生是否有執(zhí)業(yè)資格,那來這里就對了?!〈蠹叶贾垃F(xiàn)在很多亂七八糟的民辦醫(yī)院,還有民間游醫(yī),以及晚上電視廣告里騙人的老專家。這些騙子經(jīng)常把老人家的錢騙走,而做兒孫的我們,怎么跟老人家講,老人家也不信我們,因?yàn)檫@些騙子裝專家太像了!遇到過這種事,有時候跟老人解釋也不愿聽。這時候政府網(wǎng)站的查詢功能就很重要啦。
6、中央機(jī)構(gòu)編制委員會的網(wǎng)站
網(wǎng)址:http://guide.conac.cn/www/index/index.html
還記得前段時間大鬧岳陽某監(jiān)獄的“聯(lián)合國官員”么,現(xiàn)在很多騙子偽造各種奇怪證件,然后自稱官員四處行騙。有的一時半會真不好分辨。有了這個網(wǎng)站就不用怕了。比如上圖中是一個被新聞公開過的假機(jī)構(gòu),雖然它的名字煞有介事,實(shí)際上一查就原形畢露。你多了四個字是鬧哪樣??!職權(quán)略大了吧!
7、中國打擊侵權(quán)假冒工作網(wǎng)
網(wǎng)址:http://www.ipraction.cn/tszn/index.shtml
前面介紹的網(wǎng)站大多數(shù)是查詢?yōu)橹鳎@個網(wǎng)站則是各類投訴大全。由全國打擊侵犯知識產(chǎn)權(quán)和制售假冒偽劣商品工作領(lǐng)導(dǎo)小組辦公室主辦,這是2010年成立的,是國務(wù)院下設(shè)的工作小組。從網(wǎng)站的投訴指南板塊中,可以看到各種維權(quán)假冒行為的投訴指導(dǎo)。
8、工信部電信用戶申訴受理中心
網(wǎng)址:http://www.chinatcc.gov.cn:8080/cms/shensus/
不要被這個名字迷惑,認(rèn)為只能投訴中國電信的。就像郵政受理快遞投訴一樣,工信部電信投訴,受理的是各大運(yùn)營商的。比如你的手機(jī)莫名其妙被訂購了某項(xiàng)業(yè)務(wù),寬帶被限速或者被電信DNS或路由劫持,甚至手機(jī)信號有問題都可以投訴。用戶申訴受理中心處理問題十分高效,而且每一個申訴都會得到回復(fù)。
9、國土資源部珠寶玉石首飾管理中心
網(wǎng)址:http://www.ngtc.gov.cn/ngtc/channel/certi/certi_search.jsp
國土資源部珠寶玉石首飾管理中心是國家質(zhì)量監(jiān)督檢驗(yàn)檢疫總局依法授權(quán)的國家級珠寶玉石專業(yè)質(zhì)檢機(jī)構(gòu),是國內(nèi)珠寶玉石檢測方面的權(quán)威機(jī)構(gòu)?,F(xiàn)在網(wǎng)絡(luò)以及電視購物中很多賣寶石的,而且都宣稱有證書,最后價格往往都是99.8。如果來這個網(wǎng)站查詢,立馬可以知道具體情況和真假。
10、各地政府網(wǎng)站省長/市長信箱
湖南省長信箱網(wǎng)址:http://www.hunan.gov.cn/hdjl/szxx/
長沙市長信箱網(wǎng)址:http://www.changsha.gov.cn/zmhd/szxx/
小編家里曾經(jīng)收不到明信片,自己在同一個城市另一個郵局寄也寄不到。后來無奈之下在市長信箱留言,發(fā)現(xiàn)效果很好。沒過幾天小編就接到了郵政所領(lǐng)導(dǎo)打來的電話,再三詢問小編家里的地址以及信件收發(fā)情況等。然后郵遞員也打來電話道歉,表示以后會留意小編的信件,然后小編家里從此就能收到明信片啦!省長/市長信箱也是每封信必回,而且很多相關(guān)投訴會轉(zhuǎn)到有關(guān)部門進(jìn)行回復(fù),效率很高!
(編輯|逼夢 資料來源:綜合天涯網(wǎng)友“冰糖雪梨打火機(jī)”)
本文選自瀟湘晨報(bào),更多輕松有趣內(nèi)容請關(guān)注瀟湘晨報(bào)微信(xxcbwx)以及瀟湘晨報(bào)微博(@瀟湘晨報(bào))
果你是一個初學(xué)者,你每完成一個新項(xiàng)目后自身能力都會有極大的提高,如果你是一個有經(jīng)驗(yàn)的數(shù)據(jù)科學(xué)專家,你已經(jīng)知道這里所蘊(yùn)含的價值。
本文將為您提供一個網(wǎng)站/資源列表,從中你可以使用數(shù)據(jù)來完成你自己的數(shù)據(jù)項(xiàng)目,甚至創(chuàng)造你自己的產(chǎn)品。
一.如何使用這些資源?
如何使用這些數(shù)據(jù)源是沒有限制的,應(yīng)用和使用只受到您的創(chuàng)造力和實(shí)際應(yīng)用。使用它們最簡單的方法是進(jìn)行數(shù)據(jù)項(xiàng)目并在網(wǎng)站上發(fā)布它們。這不僅能提高你的數(shù)據(jù)和可視化技能,還能改善你的結(jié)構(gòu)化思維。另一方面,如果你正在考慮/處理基于數(shù)據(jù)的產(chǎn)品,這些數(shù)據(jù)集可以通過提供額外的/新的輸入數(shù)據(jù)來增加您的產(chǎn)品的功能。所以,繼續(xù)在這些項(xiàng)目上工作吧,與更大的世界分享它們,以展示你的數(shù)據(jù)能力!我們已經(jīng)在不同的部分中劃分了這些數(shù)據(jù)源,以幫助你根據(jù)應(yīng)用程序?qū)?shù)據(jù)源進(jìn)行分類。我們從簡單、通用和易于處理數(shù)據(jù)集開始,然后轉(zhuǎn)向大型/行業(yè)相關(guān)數(shù)據(jù)集。然后,我們?yōu)樘囟ǖ哪康摹谋就诰?、圖像分類、推薦引擎等提供數(shù)據(jù)集的鏈接。這將為您提供一個完整的數(shù)據(jù)資源列表。如果你能想到這些數(shù)據(jù)集的任何應(yīng)用,或者知道我們漏掉了什么流行的資源,請?jiān)谙旅娴脑u論中與我們分享。(部分可能需要翻墻)
二.由簡單和通用的數(shù)據(jù)集開始
1.data.gov( https://www.data.gov/ )
這是美國政府公開數(shù)據(jù)的所在地,該站點(diǎn)包含了超過19萬的數(shù)據(jù)點(diǎn)。這些數(shù)據(jù)集不同于氣候、教育、能源、金融和更多領(lǐng)域的數(shù)據(jù)。
2.data.gov.in( https://data.gov.in/ )
這是印度政府公開數(shù)據(jù)的所在地,通過各種行業(yè)、氣候、醫(yī)療保健等來尋找數(shù)據(jù),你可以在這里找到一些靈感。根據(jù)你居住的國家的不同,你也可以從其他一些網(wǎng)站上瀏覽類似的網(wǎng)站。
3.WorldBank( http://data.worldbank.org/ )
世界銀行的開放數(shù)據(jù)。該平臺提供 Open Data Catalog,世界發(fā)展指數(shù),教育指數(shù)等幾個工具。
4.RBI( https://rbi.org.in/Scripts/Statistics.aspx )
印度儲備銀行提供的數(shù)據(jù)。這包括了貨幣市場操作、收支平衡、銀行使用和一些產(chǎn)品的幾個指標(biāo)。
5.Five ThirtyEight Datasets ( https://github.com/fivethirtyeight/data )
Five Thirty Eight,亦稱作 538,專注與民意調(diào)查分析,政治,經(jīng)濟(jì)與體育的博客。該數(shù)據(jù)集為 Five ThirtyEight Datasets 使用的數(shù)據(jù)集。每個數(shù)據(jù)集包括數(shù)據(jù),解釋數(shù)據(jù)的字典和Five ThirtyEight 文章的鏈接。如果你想學(xué)習(xí)如何創(chuàng)建數(shù)據(jù)故事,沒有比這個更好。
三.大型數(shù)據(jù)集
1.Amazon WebServices(AWS)datasets
( https://aws.amazon.com/cn/datasets/ )
Amazon提供了一些大數(shù)據(jù)集,可以在他們的平臺上使用,也可以在本地計(jì)算機(jī)上使用。您還可以通過EMR使用EC2和Hadoop來分析云中的數(shù)據(jù)。在亞馬遜上流行的數(shù)據(jù)集包括完整的安然電子郵件數(shù)據(jù)集,Google Booksn-gram,NASA NEX 數(shù)據(jù)集,百萬歌曲數(shù)據(jù)集等。
2.Googledatasets
( https://cloud.google.com/bigquery/public-data/ )
Google 提供了一些數(shù)據(jù)集作為其 Big Query 工具的一部分。包括 GitHub 公共資料庫的數(shù)據(jù),Hacker News 的所有故事和評論。
3.Youtubelabeled Video Dataset
( https://research.google.com/youtube8m/ )
幾個月前,谷歌研究小組發(fā)布了YouTube上的“數(shù)據(jù)集”,它由800萬個YouTube視頻id和4800個視覺實(shí)體的相關(guān)標(biāo)簽組成。它來自數(shù)十億幀的預(yù)先計(jì)算的,最先進(jìn)的視覺特征。
四.預(yù)測建模與機(jī)器學(xué)習(xí)數(shù)據(jù)集
1.UCI MachineLearning Repository
( https://archive.ics.uci.edu/ml/datasets.html )
UCI機(jī)器學(xué)習(xí)庫顯然是最著名的數(shù)據(jù)存儲庫。如果您正在尋找與機(jī)器學(xué)習(xí)存儲庫相關(guān)的數(shù)據(jù)集,通常是首選的地方。這些數(shù)據(jù)集包括了各種各樣的數(shù)據(jù)集,從像Iris和泰坦尼克這樣的流行數(shù)據(jù)集到最近的貢獻(xiàn),比如空氣質(zhì)量和GPS軌跡。存儲庫包含超過350個與域名類似的數(shù)據(jù)集(分類/回歸)。您可以使用這些過濾器來確定您需要的數(shù)據(jù)集。
2.Kaggle
( https://www.kaggle.com/datasets )
Kaggle提出了一個平臺,人們可以貢獻(xiàn)數(shù)據(jù)集,其他社區(qū)成員可以投票并運(yùn)行內(nèi)核/腳本。他們總共有超過350個數(shù)據(jù)集——有超過200個特征數(shù)據(jù)集。雖然一些最初的數(shù)據(jù)集通常出現(xiàn)在其他地方,但我在平臺上看到了一些有趣的數(shù)據(jù)集,而不是在其他地方出現(xiàn)。與新的數(shù)據(jù)集一起,界面的另一個好處是,您可以在相同的界面上看到來自社區(qū)成員的腳本和問題。
3.AnalyticsVidhya
(https://datahack.analyticsvidhya.com/contest/all/ )
您可以從我們的實(shí)踐問題和黑客馬拉松問題中參與和下載數(shù)據(jù)集。問題數(shù)據(jù)集基于真實(shí)的行業(yè)問題,并且相對較小,因?yàn)樗鼈円馕吨? - 7天的黑客馬拉松。
4.Quandl
( https://www.quandl.com/ )
Quandl 通過起網(wǎng)站、API 或一些工具的直接集成提供了不同來源的財(cái)務(wù)、經(jīng)濟(jì)和替代數(shù)據(jù)。他們的數(shù)據(jù)集分為開放和付費(fèi)。所有開放數(shù)據(jù)集為免費(fèi),但高級數(shù)據(jù)集需要付費(fèi)。通過搜索仍然可以在平臺上找到優(yōu)質(zhì)數(shù)據(jù)集。例如,來自印度的證券交易所數(shù)據(jù)是免費(fèi)的。
5.Past KDDCups
( http://www.kdd.org/kdd-cup )
KDD Cup 是 ACM Special Interest Group 組織的年度數(shù)據(jù)挖掘和知識發(fā)現(xiàn)競賽。
6.DrivenData
( https://www.drivendata.org/ )
Driven Data 發(fā)現(xiàn)運(yùn)用數(shù)據(jù)科學(xué)帶來積極社會影響的現(xiàn)實(shí)問題。然后,他們?yōu)閿?shù)據(jù)科學(xué)家組織在線模擬競賽,從而開發(fā)出最好的模型來解決這些問題。
五.圖像分類數(shù)據(jù)集
1.The MNISTDatabase
( http://yann.lecun.com/exdb/mnist/ )
最流行的圖像識別數(shù)據(jù)集,使用手寫數(shù)字。它包括6萬個示例和1萬個示例的測試集。這通常是第一個進(jìn)行圖像識別的數(shù)據(jù)集。
2.Chars74K
(http://www.ee.surrey.ac.uk/CVSSP/demos/chars74k/ )
這里是下一階段的進(jìn)化,如果你已經(jīng)通過了手寫的數(shù)字。該數(shù)據(jù)集包括自然圖像中的字符識別。數(shù)據(jù)集包含74,000個圖像,因此數(shù)據(jù)集的名稱。
3.Frontal FaceImages
(http://vasc.ri.cmu.edu//idb/html/face/frontal_images/index.html )
如果你已經(jīng)完成了前兩個項(xiàng)目,并且能夠識別數(shù)字和字符,這是圖像識別中的下一個挑戰(zhàn)級別——正面人臉圖像。這些圖像是由CMU & MIT收集的,排列在四個文件夾中。
4.ImageNet
( http://image-net.org/ )
現(xiàn)在是時候構(gòu)建一些通用的東西了。根據(jù)WordNet層次結(jié)構(gòu)組織的圖像數(shù)據(jù)庫(目前僅為名詞)。層次結(jié)構(gòu)的每個節(jié)點(diǎn)都由數(shù)百個圖像描述。目前,該集合平均每個節(jié)點(diǎn)有超過500個圖像(而且還在增加)。
六.文本分類數(shù)據(jù)集
1.Spam – NonSpam
(http://www.esp.uem.es/jmgomez/smsspamcorpus/)
區(qū)分短信是否為垃圾郵件是一個有趣的問題。你需要構(gòu)建一個分類器將短信進(jìn)行分類。
2.TwitterSentiment Analysis
(http://thinknook.com/twitter-sentiment-analysis-training-corpus-dataset-2012-09-22/)
該數(shù)據(jù)集包含 1578627 個分類推文,每行被標(biāo)記為1的積極情緒,0位負(fù)面情緒。數(shù)據(jù)依次基于 Kaggle 比賽和 Nick Sanders 的分析。
3.Movie ReviewData
(http://www.cs.cornell.edu/People/pabo/movie-review-data/)
這個網(wǎng)站提供了一系列的電影評論文件,這些文件標(biāo)注了他們的總體情緒極性(正面或負(fù)面)或主觀評價(例如,“兩個半明星”)和對其主觀性地位(主觀或客觀)或極性的標(biāo)簽。
七.推薦引擎數(shù)據(jù)集
1.MovieLens
( https://grouplens.org/ )
MovieLens 是一個幫助人們查找電影的網(wǎng)站。它有成千上萬的注冊用戶。他們進(jìn)行自動內(nèi)容推薦,推薦界面,基于標(biāo)簽的推薦頁面等在線實(shí)驗(yàn)。這些數(shù)據(jù)集可供下載,可用于創(chuàng)建自己的推薦系統(tǒng)。
2.Jester
(http://www.ieor.berkeley.edu/~goldberg/jester-data/)
在線笑話推薦系統(tǒng)。
八.各種來源的數(shù)據(jù)集網(wǎng)站
1.KDNuggets
(http://www.kdnuggets.com/datasets/index.html)
KDNuggets 的數(shù)據(jù)集頁面一直是人們搜索數(shù)據(jù)集的參考。列表全面,但是某些來源不再提供數(shù)據(jù)集。因此,需要謹(jǐn)慎選擇數(shù)據(jù)集和來源。
2.Awesome PublicDatasets
(https://github.com/caesar0301/awesome-public-datasets)
一個GitHub存儲庫,它包含一個由域分類的完整的數(shù)據(jù)集列表。數(shù)據(jù)集被整齊地分類在不同的領(lǐng)域,這是非常有用的。但是,對于存儲庫本身的數(shù)據(jù)集沒有描述,這可能使它非常有用。
3.RedditDatasets Subreddit
(https://www.reddit.com/r/datasets/)
由于這是一個社區(qū)驅(qū)動的論壇,它可能會遇到一些麻煩(與之前的兩個來源相比)。但是,您可以通過流行/投票來對數(shù)據(jù)集進(jìn)行排序,以查看最流行的數(shù)據(jù)集。另外,它還有一些有趣的數(shù)據(jù)集和討論。
九.結(jié)尾的話
我們希望這一資源清單對于那些想項(xiàng)目的人來說是非常有用的。這絕對是一個金礦,好好加以利用吧!
到URL路徑,對于我們這些還未入門的呆傻小白來說,腦中只有一個概念,那就是把URL路徑做得越短越好。然而,為什么要把路徑做短,URL優(yōu)化到底是為了什么呢?讓我們說,說不出太多所以然來。昨晚又搭乘著西風(fēng)老司機(jī)開的車,讓我們這些小白總算是有了些規(guī)范的認(rèn)識。結(jié)合網(wǎng)上查的一些資料,我為大家說明,為什么要做URL路徑的優(yōu)化集權(quán)?怎么做URL路徑的優(yōu)化集權(quán)?
首先介紹什么是URL。
URL就是我們口中的網(wǎng)址、鏈接、路徑。它有三種表現(xiàn)形式:
1.動態(tài)路徑
動態(tài)的URL路徑,導(dǎo)向的是動態(tài)頁面。它具有如下特征:1.路徑中出現(xiàn)了“?”“%”“&”“=”等動態(tài)參數(shù)符號;2.以.asp,.php,.asp.net結(jié)尾。
2.靜態(tài)路徑
靜態(tài)的URL路徑,導(dǎo)向靜態(tài)頁面,它具有如下特征:1.以目錄形式呈現(xiàn);2.以.htm .html .xhtml結(jié)尾。
3.偽靜態(tài)路徑
偽靜態(tài)的URL路徑,它所指的就是把一個動態(tài)的URL路徑通過技術(shù)手段,變成靜態(tài)的URL路徑的一種形式,偽靜態(tài)URL路徑從本質(zhì)上說,與全靜態(tài)URL路徑?jīng)]什么區(qū)別,最好是以htm或html結(jié)尾比較好。
注意:
1.一個網(wǎng)站只允許設(shè)置一種路徑,要么都是動態(tài)路徑,要么都是靜態(tài)路徑,不允許同時出現(xiàn)兩種路徑連接,如果有第二種連接一定要屏蔽,可以用robots文件進(jìn)行屏蔽。
2.動態(tài)路徑中參數(shù)數(shù)量不能超過三個,如果超過三個,蜘蛛在抓取的時候會有參數(shù)丟失,而造成頁面抓取失敗的情況,需要通過技術(shù)優(yōu)化,形成可利于蜘蛛抓取的URL,或者轉(zhuǎn)換成為偽靜態(tài)。
其次,讓我們了解,什么是權(quán)重,為什么要對URL路徑進(jìn)行優(yōu)化集權(quán)。
權(quán)重代表著搜索引擎對網(wǎng)站的信任度。是繼承在站點(diǎn)的每一個頁面,權(quán)重越高,越利于關(guān)鍵詞排名,但不決定排名。體現(xiàn)在網(wǎng)站的內(nèi)容,外鏈投票,網(wǎng)站結(jié)構(gòu),網(wǎng)站的受重,時效性等。
集權(quán)是為了把權(quán)重高的集中在一起,提高關(guān)鍵詞的排名競爭力度。搜索引擎抓取網(wǎng)頁的時候只認(rèn)路徑的,因此對于搜索引擎而言,路徑中多或者少一個字母、數(shù)字、符號,都是一個新的路徑。有一些不同的路徑指向同一個頁面的情況需要設(shè)置一下,將途經(jīng)規(guī)范化從而集中于一個路徑,達(dá)到權(quán)重集中的效果。
如何進(jìn)行集權(quán)?
1.路徑唯一性
多條路徑指向同一個頁面,我們選擇重點(diǎn)路徑進(jìn)行優(yōu)化。我們設(shè)置默認(rèn)首頁、301永久重定向、robots.txt屏蔽。
其中,301永久重定向?qū)τ趲ww的和不帶www的都要解析(只解析其中一條是錯誤的。)如果網(wǎng)站發(fā)展二級域名,就跳轉(zhuǎn)到不帶www的;如果不發(fā)展二級域名,就301重定向到帶www的。
2.網(wǎng)站首頁去“尾巴”
所謂的網(wǎng)站首頁去“尾巴”,就是有的網(wǎng)站首頁URL路徑中出現(xiàn)了很長的尾巴,例如:尾巴的后綴為“網(wǎng)址/index.html”、“網(wǎng)址/index.php”等這種情況,那么,我們就必須把首頁URL路徑的這個尾巴給去除掉,因?yàn)?,這樣帶一個尾巴來說對于優(yōu)化是很不好的,會導(dǎo)致URL路徑多了一個層次,加大路徑的層次深度,也加大了搜索引擎蜘蛛抓取的難度。
最后,讓我們來了解,如何對URL路徑進(jìn)行優(yōu)化。
1.盡量使URL路徑變得更短
這個主要是站在用戶的角度考慮了。因?yàn)閁RL越短,代表用戶就越方便記憶,用戶看起來也沒有那么費(fèi)事。URL路徑越長,權(quán)重越低。且URL不能超過60字節(jié)。
2.URL路徑中的層級數(shù)量不能超過三層
網(wǎng)站URL路徑設(shè)置的層級數(shù)量不能太深,因?yàn)?,如果設(shè)置得太深的話,搜索引擎蜘蛛是很難爬取到這些路徑頁面里的內(nèi)容的。一般情況下,中小型的站點(diǎn)建議控制在三層以內(nèi)。大型站點(diǎn)則不在此限制范圍內(nèi),但如果層次太多,可以加一級域名,從而達(dá)到縮短層次的目的。另外,結(jié)構(gòu)層級超過5層,搜索引擎就不會抓取了。
3.優(yōu)化URL路徑中的字符名稱
網(wǎng)站URL路徑中的字符名稱,不能出現(xiàn)中文字符,一定要使用英文字符來代替,而且最好是以小寫全拼的拼音形式,來作為二級欄目的路徑名稱來使用,因?yàn)?,如果使用中文字符作為網(wǎng)站的URL路徑,那么,搜索引擎是不能識別出來的,也就是代表這條中文字符的URL路徑不能被抓取了。網(wǎng)站URL路徑的后綴使用全拼的拼音形式,這樣一方面有利于用戶的記憶,另一方面也利用搜索引擎的抓取收錄。
4.保證URL路徑的結(jié)構(gòu)清晰
清晰簡短的目錄結(jié)構(gòu)和規(guī)范的命名不僅有利于用戶體驗(yàn)和網(wǎng)址傳播,更是搜索引擎友好的體現(xiàn)。瀏覽路徑讓網(wǎng)站的導(dǎo)航結(jié)構(gòu)更清晰,可以更加平衡的分布 網(wǎng)站權(quán)重。并且對于搜索引擎來說,瀏覽路徑所在位置也是其抓取的重要內(nèi)容。
5.URL中盡量包含關(guān)鍵詞
當(dāng)我們在設(shè)計(jì)URL時,將關(guān)鍵詞放入URL中也是優(yōu)化的一個點(diǎn)。其作用就是:提高頁面相關(guān)性,在排名時貢獻(xiàn)一點(diǎn)分?jǐn)?shù)。關(guān)鍵詞出現(xiàn)得越靠前越好,也就是說在域名中最好,其次是出現(xiàn)在目錄中,效果最小的是出現(xiàn)在文件名中。不過切記不可為了出現(xiàn)關(guān)鍵詞而堆砌。
下面是小編在公司整理到的一些行業(yè)優(yōu)化教程和SEO優(yōu)化工具包(部分截圖), 關(guān)注小編并私信”SEO“即可免費(fèi)領(lǐng)取哦!
35G行業(yè)優(yōu)化方案,SEO教程包含:最基礎(chǔ)的建站搭建內(nèi)部優(yōu)化+網(wǎng)站定位 [原創(chuàng)偽原創(chuàng)內(nèi)容制作技巧,內(nèi)鏈系統(tǒng)優(yōu)化建立]到網(wǎng)站運(yùn)營,網(wǎng)站推廣思路策劃,SEO項(xiàng)目實(shí)戰(zhàn)的學(xué)習(xí)資料都有整理,送給每一位SEO小伙伴, 有想學(xué)習(xí)SEO的,或是轉(zhuǎn)行,或是大學(xué)生,還有工作中想提升自己能力的,正在學(xué)習(xí)的小伙伴歡迎加入學(xué)習(xí)!
*請認(rèn)真填寫需求信息,我們會在24小時內(nèi)與您取得聯(lián)系。