Warning: error_log(/data/www/wwwroot/hmttv.cn/caches/error_log.php): failed to open stream: Permission denied in /data/www/wwwroot/hmttv.cn/phpcms/libs/functions/global.func.php on line 537 Warning: error_log(/data/www/wwwroot/hmttv.cn/caches/error_log.php): failed to open stream: Permission denied in /data/www/wwwroot/hmttv.cn/phpcms/libs/functions/global.func.php on line 537
個(gè)寫博客的朋友想讓我?guī)兔Λ@取一下豆瓣上的Top250的電影數(shù)據(jù),說是做個(gè)什么電影推薦榜,沒辦法之后硬著頭皮拿出我那一小點(diǎn)點(diǎn)的Python爬蟲技術(shù)來完成人家的需求了。當(dāng)然了也是在不違法的情況下進(jìn)行的。
要爬取豆瓣電影排名信息,我們可以使用Python中的Request庫來發(fā)送一個(gè)請(qǐng)求,然后使用一些HTML解析工具例如BeautifulSoup或者是通過Lxml庫來對(duì)HTML頁面進(jìn)行解析,然后將解析到的結(jié)果打印出來。
import requests
from bs4 import BeautifulSoup
def crawl_douban_movies(url):
# 發(fā)送 HTTP GET 請(qǐng)求獲取頁面內(nèi)容
response = requests.get(url)
if response.status_code == 200:
# 使用 BeautifulSoup 解析頁面內(nèi)容
soup = BeautifulSoup(response.text, 'html.parser')
# 找到電影列表
movie_list = soup.find_all('div', class_='item')
for movie in movie_list:
# 獲取電影名稱和評(píng)分
title = movie.find('span', class_='title').text
rating = movie.find('span', class_='rating_num').text
print(f"電影:{title},評(píng)分:{rating}")
else:
print("請(qǐng)求失敗")
if __name__ == "__main__":
# 豆瓣電影 Top 250 頁面 URL
url = "https://movie.douban.com/top250"
crawl_douban_movies(url)
是不是有點(diǎn)簡(jiǎn)單了?在這個(gè)例子中我們通過requests.get()發(fā)送HTTP GET請(qǐng)求獲取豆瓣電影Top250頁面的HTML內(nèi)容。然后,使用BeautifulSoup解析頁面內(nèi)容,提取出電影名稱和評(píng)分,并打印出來。
運(yùn)行程序之后,發(fā)現(xiàn)居然給我來了個(gè)請(qǐng)求失敗?這是為什么呢?是網(wǎng)絡(luò)請(qǐng)求不通?還是說豆瓣網(wǎng)站對(duì)相關(guān)的操作有所限制呢?
經(jīng)過驗(yàn)證發(fā)現(xiàn)豆瓣網(wǎng)站可能設(shè)置了反爬蟲機(jī)制,檢測(cè)到了爬蟲行為并阻止了請(qǐng)求。為了規(guī)避這種情況,我嘗試設(shè)置請(qǐng)求頭信息,來模擬正常的瀏覽器訪問。
為了模擬正常瀏覽器的訪問操作,所以添加了請(qǐng)求頭信息,將代碼升級(jí)成如下的樣子。
import requests
from bs4 import BeautifulSoup
def crawl_douban_movies(url):
# 添加 User-Agent 請(qǐng)求頭信息
headers = {
'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/89.0.4389.90 Safari/537.36'
}
# 發(fā)送帶有請(qǐng)求頭信息的 HTTP GET 請(qǐng)求
response = requests.get(url, headers=headers)
if response.status_code == 200:
# 使用 BeautifulSoup 解析頁面內(nèi)容
soup = BeautifulSoup(response.text, 'html.parser')
# 找到電影列表
movie_list = soup.find_all('div', class_='item')
for movie in movie_list:
# 獲取電影名稱和評(píng)分
title = movie.find('span', class_='title').text
rating = movie.find('span', class_='rating_num').text
print(f"電影:{title},評(píng)分:{rating}")
else:
print("請(qǐng)求失敗")
if __name__ == "__main__":
# 豆瓣電影 Top 250 頁面 URL
url = "https://movie.douban.com/top250"
crawl_douban_movies(url)
與之前不同的是,我們添加了User-Agent請(qǐng)求頭信息。這樣這個(gè)請(qǐng)求就是模擬瀏覽器發(fā)送的。應(yīng)該算是正常請(qǐng)求了。果然,運(yùn)行代碼之后,結(jié)果如下。
正當(dāng)我以為這樣就可以的時(shí)候,朋友居然說為什么沒有導(dǎo)演的信息,為什么沒有那個(gè)簡(jiǎn)單的評(píng)語的信息呀?我勒個(gè)去?還要這么麻煩么?這就不得不讓我去分析一下頁面了
打開網(wǎng)頁開發(fā)這工具,簡(jiǎn)單的分析頁面之后,有了這樣的結(jié)果。如下所示。
導(dǎo)演信息,在一個(gè)div里面,并且class叫做bd,在這個(gè)div里面有個(gè)p標(biāo)簽,這個(gè)p標(biāo)簽中就是導(dǎo)演的信息。那么這樣我們就可以通過如下的操作來獲取了。
# 獲取導(dǎo)演信息
directors = movie.find('div', class_='bd').find('p').text.split('\n')[1].strip().split('\xa0\xa0\xa0')
那么評(píng)語信息又在什么地方呢?
簡(jiǎn)單查找之后發(fā)現(xiàn),評(píng)語在一個(gè)span標(biāo)簽中這就簡(jiǎn)單了,我們可以通過如下的方式來進(jìn)行獲取。
quote = movie.find('span', class_='inq').text if movie.find('span', class_='inq') else ''
整體代碼修改變成了如下的樣子。
import requests
from bs4 import BeautifulSoup
def crawl_douban_movies(url):
# 添加 User-Agent 請(qǐng)求頭信息
headers = {
'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/89.0.4389.90 Safari/537.36'
}
# 發(fā)送帶有請(qǐng)求頭信息的 HTTP GET 請(qǐng)求
response = requests.get(url, headers=headers)
if response.status_code == 200:
# 使用 BeautifulSoup 解析頁面內(nèi)容
soup = BeautifulSoup(response.text, 'html.parser')
# 找到電影列表
movie_list = soup.find_all('div', class_='item')
for movie in movie_list:
# 獲取電影名稱
title = movie.find('span', class_='title').text
# 獲取導(dǎo)演信息
directors = movie.find('div', class_='bd').find('p').text.split('\n')[1].strip().split('\xa0\xa0\xa0')
director = directors[0].strip().split(':')[-1]
# 獲取評(píng)語
quote = movie.find('span', class_='inq').text if movie.find('span', class_='inq') else ''
print(f"電影:{title},導(dǎo)演:{director},評(píng)語:{quote}")
else:
print("請(qǐng)求失敗")
if __name__ == "__main__":
# 豆瓣電影 Top 250 頁面 URL
url = "https://movie.douban.com/top250"
crawl_douban_movies(url)
運(yùn)行上述代碼之后,結(jié)果如下所示,我心想,這下應(yīng)該就可以了吧,然后人家說評(píng)分沒有了,我去,這東西還能難得我么?我就把評(píng)分的代碼給復(fù)制粘貼到這段代碼中。
將評(píng)分的獲取代碼復(fù)制粘貼完成之后,得到了如下的結(jié)果
我就說這是不是很完美了,他居然說還不行?他還要下面的時(shí)間信息、產(chǎn)地信息這些?我去這咋玩?
其實(shí)獲取時(shí)間信息和獲取產(chǎn)地信息的方式跟上面的操作是一樣的。只需要通過查看代碼,找到對(duì)應(yīng)的HTML標(biāo)識(shí)就可以提取到對(duì)應(yīng)的信息。
在獲取電影詳細(xì)信息的時(shí)候遇到了格式處理的問題,如下所示。
# 獲取電影詳情信息
details = movie.find('div', class_='bd').find('p').text.split('\n')
info = [i.strip() for i in details if i.strip() != '']
#print("獲取到信息",info) # 打印詳情信息列表
# 提取時(shí)間、產(chǎn)地和劇情信息
if len(info) >= 2:
year_region = info[1].split('\xa0/\xa0')
year = year_region[0].strip()
region = year_region[1].strip()
plot = info[1].strip()
else:
year = "未知"
region = "未知"
plot = "未知"
要獲取電影的詳細(xì)頁面 URL,需要從每個(gè)電影條目中提取鏈接信息。豆瓣電影條目的鏈接通常包含在a標(biāo)簽的href屬性中如下圖所示。
通過如下的操作來獲取到對(duì)應(yīng)屬性中的數(shù)據(jù)
detail_url = movie.find('a')['href']
最終獲取完成的電影信息如下圖所示。
到這里,人家的需求才算提完,原來現(xiàn)在電影博主都這么卷的了么?想要這么多信息,居然不自己整理,讓我這個(gè)小嘍嘍來幫他實(shí)現(xiàn)。真實(shí)有天賦呀?
在滿足了他所有的要求之后,最終我們給出詳細(xì)的代碼
import requests
from bs4 import BeautifulSoup
def crawl_douban_movies(url):
# 添加 User-Agent 請(qǐng)求頭信息
headers = {
'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/89.0.4389.90 Safari/537.36'
}
# 發(fā)送帶有請(qǐng)求頭信息的 HTTP GET 請(qǐng)求
response = requests.get(url, headers=headers)
if response.status_code == 200:
# 使用 BeautifulSoup 解析頁面內(nèi)容
soup = BeautifulSoup(response.text, 'html.parser')
# 找到電影列表
movie_list = soup.find_all('div', class_='item')
for movie in movie_list:
# 獲取電影名稱
title = movie.find('span', class_='title').text
rating = movie.find('span', class_='rating_num').text
# 獲取電影詳細(xì)頁面鏈接
detail_url = movie.find('a')['href']
# 獲取導(dǎo)演信息
directors = movie.find('div', class_='bd').find('p').text.split('\n')[1].strip().split('\xa0\xa0\xa0')
director = directors[0].strip().split(':')[-1]
# 獲取評(píng)語
quote = movie.find('span', class_='inq').text if movie.find('span', class_='inq') else ''
# 獲取電影詳情信息
details = movie.find('div', class_='bd').find('p').text.split('\n')
info = [i.strip() for i in details if i.strip() != '']
#print("獲取到信息",info) # 打印詳情信息列表
# 提取時(shí)間、產(chǎn)地和劇情信息
if len(info) >= 2:
year_region = info[1].split('\xa0/\xa0')
year = year_region[0].strip()
region = year_region[1].strip()
plot = info[1].strip()
else:
year = "未知"
region = "未知"
plot = "未知"
print(f"電影:{title}\n評(píng)分:{rating}\n導(dǎo)演:{director}\n評(píng)語:{quote}\n時(shí)間:{year}\n產(chǎn)地:{region}\n劇情:{plot}\n詳細(xì)頁面鏈接:{detail_url}\n")
else:
print("請(qǐng)求失敗")
if __name__ == "__main__":
# 豆瓣電影 Top 250 頁面 URL
url = "https://movie.douban.com/top250"
crawl_douban_movies(url)
通過上述代碼,我們就可以獲取到豆瓣電影TOP250的所有電影信息,當(dāng)然這里需要手動(dòng)的將頁碼信息進(jìn)行添加,例如第二頁的URL就會(huì)變成https://movie.douban.com/top250?start=25&filter= 樣子,在實(shí)際操作的時(shí)候我們可以自己進(jìn)行調(diào)整。
網(wǎng)頁效果
每個(gè)li標(biāo)簽中有一部電影
我們獲取每個(gè)li,再對(duì)其子節(jié)點(diǎn)進(jìn)行查找可以得到想要的信息。
# -*- coding: utf-8 -*-
# @Author: 搞爬蟲
# @Date: 2020-07-26 09:38:07
# @Last Modified by: 搞爬蟲
# @Last Modified time: 2020-07-26 14:54:25
#庫引入
import requests
from bs4 import BeautifulSoup
import time
定義獲取html文檔的函數(shù)
# (參數(shù):)可以指定參數(shù)類型
def getHtml(i:int,startUrl:str,headers:dict):
text = ''
#每一頁URL的區(qū)別在于start(如:第二頁URL:)
# https://movie.douban.com/top250?start=25&filter= ,以此類推
url = startUrl+'?start=' + str(i*25)
try:
r = requests.get(url,headers = headers,timeout=8)
if r.status_code == 200:
return r.text
except:
print("failed to get html")
return ""
#定義解析網(wǎng)頁的函數(shù)
def parseHtml(text:str,temp:dict) :
if text != '':
soup = bs(text,'lxml')
info_div = soup.find_all('div',class_='info')
for eachMovie in info_div:
ls = [] #這里用名稱作為字典的鍵,其他信息存放在列表中作為值
info_hd = eachMovie.find('div',class_='hd')
info_bd = eachMovie.find('div',class_='bd')
#電影名稱文本
name = info_hd.a.span.text.strip()
#電影簡(jiǎn)述文本
quote = info_bd.find('p',class_='quote').span.text.strip()
ls.append(quote)
temp[name] = ls
return temp
#定義控制臺(tái)打印信息函數(shù)
def printContent(Info:dict):
if Info is not None:
count = 0
print("{:20}\t\t{:10}\t".format("電影名稱","電影引述")) #格式化打印
#獲得每一個(gè)鍵值對(duì)
for key,value in Info.items():
if count == 10:
print('')
print("============================================")
count = 0
print("{:12}\t\t{:^20}".format(key,value[0])) #字典的值是列表類型
count += 1
else:
print('no data')
#主函數(shù)
def main():
#這里可以打開開發(fā)者工具查看正常訪問頁面的請(qǐng)求頭
#網(wǎng)頁不涉及重要信息,我們只進(jìn)行少量的爬取,不進(jìn)行偽裝也可以
headers = {'user-agent':'Mozilla/5.0'}
result = {}
startUrl = "https://movie.douban.com/top250"
num = input('要爬取多少頁(1~10)')
for i in range(eval(num)):
text = getHtml(i,startUrl,headers)
time.sleep(2) #可以間斷訪問
result = parseHtml(text,result)
printContent(result)
if __name__ == '__main__':
main()
運(yùn)行結(jié)果
改進(jìn)過后可以顯示電影的具體信息。完!
介
HTML 是什么?
htyper text markup language 即超文本標(biāo)記語言。
超文本: 就是指頁面內(nèi)可以包含圖片、鏈接,甚至音樂、程序等非文字元素。
標(biāo)記語言: 標(biāo)記(標(biāo)簽)構(gòu)成的語言。
什么是標(biāo)簽:
是由一對(duì)尖括號(hào)包裹的單詞構(gòu)成 例如: <html> *所有標(biāo)簽中的單詞不可能以數(shù)字開頭.
標(biāo)簽不區(qū)分大小寫.<html> 和 <HTML>. 推薦使用小寫.
標(biāo)簽分為兩部分: 開始標(biāo)簽<a> 和 結(jié)束標(biāo)簽</a>. 兩個(gè)標(biāo)簽之間的部分 我們叫做標(biāo)簽體.
有些標(biāo)簽功能比較簡(jiǎn)單.使用一個(gè)標(biāo)簽即可.這種標(biāo)簽叫做自閉和標(biāo)簽.例如: <br/><hr/><input/><img/>
標(biāo)簽可以嵌套.但是不能交叉嵌套. <a><b></a></b>
標(biāo)簽的屬性:
通常是以鍵值對(duì)形式出現(xiàn)的. 例如 name="nick"
屬性只能出現(xiàn)在開始標(biāo)簽 或 自閉和標(biāo)簽中.
屬性名字全部小寫. *屬性值必須使用雙引號(hào)或單引號(hào)包裹 例如 name="nick"
如果屬性值和屬性名完全一樣.直接寫屬性名即可. 例如 readonly
HTML5基本結(jié)構(gòu):
將HTML4中的DTD定義為如下結(jié)構(gòu)即可,其他不變。
<!DOCTYPE HTML>
HTML5支持的兩種指定頁面使用的字符集的方式:
使用Content-Type指定字符集
<meta http-equiv="Content-Type" content="text/html ;charset=UTF-8"/>
直接使用charset指定字符集
<meta charset="UTF-8">
<head> 標(biāo)簽
<title>
<title>Title</title>
<base/>
標(biāo)簽為頁面上的所有鏈接規(guī)定默認(rèn)地址或默認(rèn)目標(biāo)。
<!DOCTYPE html>
<html lang="en">
<head>
<meta charset="UTF-8">
<title>Title</title>
<base href="http://p_w_picpaths.cnblogs.com/cnblogs_com/suoning/845162/"/>
<base target="_blank" />
</head>
<body>
<img src="o_s.png" alt="圖片加載失敗。。。"/>
<a href="http://cnblogs.com/suoning/">nick blogs</a>
</body>
</html>
# 上面這段代碼中,<img>標(biāo)簽的src屬性是一個(gè)相對(duì)路徑,因?yàn)?lt;head>中通過base標(biāo)簽設(shè)置了鏈接的默認(rèn)地址,
所以img的src實(shí)際的地址是“http://p_w_picpaths.cnblogs.com/cnblogs_com/suoning/845162/o_s.png”。
同樣的,<a>中只是指定了href,并未指定target屬性,所以也會(huì)使用base中設(shè)置的target屬性的值。
<link/>
引用外部文檔,常見于引用外部樣式。重要屬性有三個(gè):rel、href、type。
rel 規(guī)定文檔與被鏈接文檔之間的關(guān)系。
rel="dns-prefetch" 預(yù)先解析緩存文檔中使用的域名,目的是為了提高網(wǎng)頁訪問速度。使用場(chǎng)景:在一個(gè)網(wǎng)頁頻繁使用其他域名資源時(shí)。
rel="shortcut icon"或rel="icon" 在收藏和標(biāo)題欄上用于顯示的圖標(biāo)。示例:<link rel="icon" href="http://p_w_picpaths.cnblogs.com/cnblogs_com/suoning/845162/o_s.png">。注意:IE瀏覽器只支持ico格式,為了兼容IE,圖片文件采用ico格式。
rel="stylesheet" 引用外部樣式表。
rel="nofollow" 用于指示搜索引擎不要追蹤(爬蟲抓取),減少垃圾鏈接。用于<a>標(biāo)簽,使用場(chǎng)景:網(wǎng)頁不被信任或是不希望唄搜索引擎錄入的網(wǎng)站。
href 資源的路徑(相對(duì)路徑/絕對(duì)路徑)。
type 規(guī)定被連接文檔的MIME類型,用于明確文件的打開方式。例如:.ico文件 p_w_picpath/x-icon。
<meta/>
定義關(guān)于HTML文檔的元數(shù)據(jù)。 重要的屬性有三個(gè):http-equiv、name、content
http-equiv 把content屬性值關(guān)聯(lián)到http頭部。
Content-Type(瀏覽器接受的文檔類型,一般是text/html)
refresh(網(wǎng)頁刷新,以秒為單位)
expires(設(shè)定網(wǎng)頁到期時(shí)間,一旦過期,必須到服務(wù)器上重傳)
<meta http-equiv="Content-Type" content="text/html ;charset=UTF-8"/>
<meta http-equiv="Refresh" content="2">
<meta http-equiv="Refresh" content="2;URL=https://www.baidu.com">
<meta http-equiv="expires" content="6 Jun 2016"/>
name 把content屬性關(guān)聯(lián)到一個(gè)名稱。
keywords(搜索關(guān)鍵字,用于搜索引擎抓取信息的顯示)
description(搜索到網(wǎng)站后顯示的網(wǎng)頁內(nèi)容簡(jiǎn)描述)
author(站點(diǎn)制作者信息)
generator(用以說明生成工具)
name也可以根據(jù)特定的功能自定義,在新浪網(wǎng)中有使用360認(rèn)證和搜狐認(rèn)證(<meta name="360-site-verification"content="63349**********"/>、<meta name="sogou_site_verification"content="BVI*******"/>)。
<meta name="keywords" content="搜索關(guān)鍵字">
<meta name="description" content="簡(jiǎn)要描述">
<meta name="author" content="http://cnblogs.com/suoning">
<meta name="generator" content="用以說明生成工具">
content 定義與http-equiv或name屬性相關(guān)的元信息,是必要的屬性。
<body> 標(biāo)簽
1、塊級(jí)標(biāo)簽和內(nèi)聯(lián)標(biāo)簽
塊級(jí)標(biāo)簽:<p><h1><table><ol><ul><form><div>
內(nèi)聯(lián)標(biāo)簽:<a><input><img><sub><sup><textarea><span>
block(塊)元素的特點(diǎn)
① 總是在新行上開始;
② 高度,行高以及外邊距和內(nèi)邊距都可控制;
③ 寬度缺省是它的容器的100%,除非設(shè)定一個(gè)寬度。
④ 它可以容納內(nèi)聯(lián)元素和其他塊元素
inline(內(nèi)聯(lián))元素的特點(diǎn)
① 和其他元素都在一行上;
② 高,行高及外邊距和內(nèi)邊距不可改變;
③ 寬度就是它的文字或圖片的寬度,不可改變
④ 內(nèi)聯(lián)元素只能容納文本或者其他內(nèi)聯(lián)元素
對(duì)行內(nèi)元素,需要注意如下
設(shè)置寬度width 無效。
設(shè)置高度height 無效,可以通過line-height來設(shè)置。
設(shè)置margin 只有左右margin有效,上下無效。
設(shè)置padding 只有左右padding有效,上下則無效。注意元素范圍是增大了,但是對(duì)元素周圍的內(nèi)容是沒影響的。
2、基本標(biāo)簽
<h1>~<h6> 標(biāo)題標(biāo)簽.
<p>: 段落標(biāo)簽. 包裹的內(nèi)容被換行.并且也上下內(nèi)容之間有一行空白.
style="text-indent: 2em"可以設(shè)置樣式為首行縮進(jìn)兩個(gè)字符。
<blockquote></blockquote>可以用來設(shè)置整個(gè)段落的縮進(jìn)。
<b> <strong>: 加粗標(biāo)簽.
<strike>: 為文字加上一條中線.
<u>: 文字下方加下劃線.
<em> <i>: 文字變成斜體.
<sup>和<sub>: 上角標(biāo) 和 下角標(biāo).
<br>:換行.
<hr>:水平線.
<div>
塊級(jí)標(biāo)簽。塊級(jí)標(biāo)簽常用于布局,行級(jí)標(biāo)簽常用語顯示內(nèi)容。
div的顯示通常使用id或class來標(biāo)識(shí)。id為唯一的標(biāo)簽標(biāo)識(shí),class為標(biāo)簽的類標(biāo)識(shí)。
div的大小是由內(nèi)容來決定的,默認(rèn)情況下,高度由內(nèi)容的高度決定,寬度適應(yīng)屏幕。
可以容納其他元素,是一個(gè)容器。
<span>
3、特殊符號(hào)
> >
< <
空格
" 引號(hào)
© 版權(quán)符號(hào)
特殊符號(hào) 符號(hào)碼
" " ;
& & ;
< < ;
> > ;
© ;
® ;
± ± ;
× × ;
§ § ;
¢ ;
¥ ;
· · ;
&euro ;
£ ;
&trade ;
4、<a> 超鏈接標(biāo)簽(錨標(biāo)簽)
重要屬性有三個(gè):href、target、name
href 超鏈接地址:可以是Web上任意資源,包括圖片,網(wǎng)頁,樣式,腳本文件等。href="#"時(shí),表示被鏈接頁面就是當(dāng)前頁面。
target 文檔打開時(shí)要顯示的目標(biāo)位置,屬性值一般有:_blank(新窗口中打開)、_self(默認(rèn),在超鏈接所在的容器中打開)、_parent(在超鏈接的父容器中打開)、_top(整個(gè)容器中打開)、name(框架名稱)。
name 錨記名稱。作用:跳轉(zhuǎn)到文檔的某個(gè)地方。返回首頁。
# 跳轉(zhuǎn)網(wǎng)頁
<a href="http://cnblogs.com/suoning" target="_blank">Nick Blogs</a>
# 跳轉(zhuǎn)錨記書簽名稱
<a name="top"><h3>Top!</h3></a>
<div style="height: 800px"></div>
<a href="#top">top</a>
1.標(biāo)簽最簡(jiǎn)式
<a href="mailto:xxx@xx.com">郵件聯(lián)系</a>
2.標(biāo)簽幫你填抄送地址
<a href="mailto:xxx@xx.com?cc=xxxx@xx.com">郵件聯(lián)系</a>
3.標(biāo)簽幫你填暗送地址
<a href="mailto:xxx@xx.com?bcc=xxxx@xx.com">郵件聯(lián)系</a>
4.暗,抄
<a href="xxxxx@xx.com">郵件聯(lián)系</a>
5.標(biāo)簽幫你填主題
<a href="mailto:xxx@xx.com?subject=這是主題">郵件聯(lián)系</a>
6.填郵件內(nèi)容
<a href="mailto:xxx@xx.com?body=這是內(nèi)容">郵件聯(lián)系</a>
7.多址發(fā)送
<a href="mailto:xxx@xx.com,xxxx@xx.com">郵件聯(lián)系</a>
# http://shang.qq.com/v3/widget.html
<a target="_blank" href="http://wpa.qq.com/msgrd?v=3&uin=630571017&site=qq&menu=yes"><img border="0" src="http://wpa.qq.com/pa?p=2:630571017:51" alt="點(diǎn)擊這里給我發(fā)消息" title="點(diǎn)擊這里給我發(fā)消息"/></a>
<a href="tencent://message/?uin=630571017" target="_blank"><img style="border:0px;" src=http://wpa.qq.com/pa?p=1:707321921:13></a>
# 更多圖片地址如下:
# http://wpa.qq.com/pa?p=1:707321921:1
# http://wpa.qq.com/pa?p=1:707321921:2
# http://wpa.qq.com/pa?p=1:707321921:3
# http://wpa.qq.com/pa?p=1:707321921:4
# http://wpa.qq.com/pa?p=1:707321921:5
# http://wpa.qq.com/pa?p=1:707321921:6
# http://wpa.qq.com/pa?p=1:707321921:7
# http://wpa.qq.com/pa?p=1:707321921:8
# http://wpa.qq.com/pa?p=1:707321921:9
# http://wpa.qq.com/pa?p=1:707321921:10
# http://wpa.qq.com/pa?p=1:707321921:11
# http://wpa.qq.com/pa?p=1:707321921:12
# http://wpa.qq.com/pa?p=1:707321921:13
5、<img> 圖形標(biāo)簽
行級(jí)標(biāo)簽,用來顯示圖片。
重要屬性有:src、title、alt、width、height、align。
src 圖片地址。
title 鼠標(biāo)懸浮在圖片上的文字。
alt 圖片找不到時(shí)要替換的文字。如果圖片資源使用的是外網(wǎng)資源,則不會(huì)顯示要替換的文字。如果使用的是本網(wǎng)站的資源(相對(duì)路徑給出),則找不到圖片時(shí)會(huì)顯示替換的文字,并保留圖片設(shè)置的寬高結(jié)構(gòu)。
align 圖片周圍文字的垂直對(duì)齊情況。常用的屬性值有:top(與圖片的頂部對(duì)齊)、middle(與圖片的中部對(duì)齊)、bottom(默認(rèn),與圖片的底部對(duì)齊)。
width 圖片的寬
height 圖片的高 (寬高兩個(gè)屬性只用一個(gè)會(huì)自動(dòng)等比縮放.)
<img src="http://p_w_picpaths.cnblogs.com/cnblogs_com/suoning/845162/o_ns.png" alt="圖片加載失敗。。。" title="The knife girl, kiss"/>
6、列表標(biāo)簽
<ul> :無序列表標(biāo)簽
<li>:列表中的每一項(xiàng).
<ol> :有序列表標(biāo)簽
<li>:列表中的每一項(xiàng).
<li>主要的屬性有:type、value兩個(gè):
type指明項(xiàng)目的類型,屬性值有:A,a,I,i,1,disc(實(shí)心圓),square(實(shí)心正方形),circle(空心圓)。
value表示序號(hào)值從幾開始。
<dl> 定義列表
<dt> 列表標(biāo)題
<dd> 列表項(xiàng)
<ur>
<li type="circle">A</li>
<li type="1">B</li>
<li type="1">C</li>
</ur>
<ol>
<li value="3">3</li>
<li>4</li>
</ol>
<dl>
<dt><i>標(biāo)題</i></dt>
<dd>第一項(xiàng)</dd>
<dd>第二項(xiàng)</dd>
<dd>第三項(xiàng)</dd>
</dl>
7、<table> 表格標(biāo)簽
<table border="1">
<thead>
<tr>
<th>序號(hào)</th>
<th>姓名</th>
</tr>
</thead>
<tbody>
<tr>
<th>1.</th>
<td>nick</td>
</tr>
<tr>
<th>2.</th>
<td>jenny</td>
</tr>
</tbody>
</table>
<table> 表格標(biāo)簽
border:(表格邊框)
align(水平對(duì)齊方式)
bgcolor(背景顏色)
cellpadding(內(nèi)邊距,單元格與內(nèi)容之間的距離)
cellspacing(外邊距,單元格的間距,設(shè)置為0時(shí),表格變?yōu)閷?shí)線表格)
width(表格的寬度,可以用%或者像素,最好通過css來設(shè)置長(zhǎng)寬)
<caption> 表格的標(biāo)題
<tr> 表格的數(shù)據(jù)行,table row
<th> 表格的表頭名稱,與<td>不同在于文字采用加粗居中的形式顯示,table head cell
<td> 單元格,用來顯示表格內(nèi)容,table data cell
<thead> 表格頭部,使結(jié)構(gòu)更加分明
<tbody> 表格主體部分,使結(jié)構(gòu)更加分明
rowspan 單元格豎跨多少行,作用在th或者td上
colspan 單元格橫跨多少列(即合并單元格),作用在th或者td上
<table>
<caption>xxxxxxxxxx</caption>
<thead>
<tr>
<th>序號(hào)</th>
<th>姓名</th>
<th>年齡</th>
<th>女神</th>
</tr>
</thead>
<tbody>
<tr>
<th>1.</th>
<td>nick</td>
<td>18</td>
<td>可可西</td>
</tr>
<tr>
<th>2.</th>
<td>jenny</td>
<td>21</td>
<td>nick!!!</td>
</tr>
</tbody>
</table>
8、<form>表單標(biāo)簽
表單屬性
HTML 表單用于接收不同類型的用戶輸入,用戶提交表單時(shí)向服務(wù)器傳輸數(shù)據(jù),從而實(shí)現(xiàn)用戶與Web服務(wù)器的交互。表單標(biāo)簽, 要提交的所有內(nèi)容都應(yīng)該在該標(biāo)簽中。
屬性:action、method、enctype
action 表單要提交的地址,用于處理表單的內(nèi)容(一般是提交字典到后臺(tái)的一個(gè)接口,這個(gè)接口是java寫成的,提交到這個(gè)接口后后臺(tái)就知道如何處理這些數(shù)據(jù)了)。
method 提交的方法,默認(rèn)是get方式提交。
get: 1.提交的鍵值對(duì).放在地址欄中url后面. 2.安全性相對(duì)較差. 3.對(duì)提交內(nèi)容的長(zhǎng)度有限制.
post:1.提交的鍵值對(duì)不在地址欄. 2.安全性相對(duì)較高. 3.對(duì)提交內(nèi)容的長(zhǎng)度理論上無限制.
enctype 對(duì)表單數(shù)據(jù)進(jìn)行編碼,默認(rèn)都是要編碼的。格式為:application/x-www-form-urlencoded(表單默認(rèn)的編碼格式,表單發(fā)送前對(duì)所有字符進(jìn)行編碼。編碼規(guī)則:空格轉(zhuǎn)換為“+”號(hào),特殊符號(hào)轉(zhuǎn)換為ASC HEX值)。提交普通的文本內(nèi)容到服務(wù)器就可以采用這種默認(rèn)的編碼方式。當(dāng)你需要提交的是一個(gè)文件時(shí),編碼就需要采用另一種格式:multipart/form-data(不對(duì)字符編碼,文件上傳時(shí)使用)。text/plain(是一種純文本編碼,空格轉(zhuǎn)換為“+”號(hào),但是不對(duì)特殊字符進(jìn)行編碼)。
<!DOCTYPE html>
<html lang="en">
<head>
<meta charset="UTF-8">
<title>Title</title>
</head>
<body>
<form action="https://www.baidu.com/s">
<input type="text" name="wd">
<input type="submit" value="百度一下">
</form>
</body>
</html>
<!DOCTYPE html>
<html lang="en">
<head>
<meta charset="UTF-8">
<title>Title</title>
</head>
<body>
<form action="https://www.sogou.com/web">
<input type="text" name="query">
<input type="submit" value="搜狗搜索">
</form>
</body>
</html>
表單元素
<input> type 屬性:
text 文本框輸入(默認(rèn)text文本框類型)。
autocomplete(自動(dòng)完成輸入的內(nèi)容,要求表單元素要有name屬性才有自動(dòng)完成的效果,off表示自動(dòng)完成不可用,on表示自動(dòng)完成可用)
disabled(設(shè)置或者獲取控件的狀態(tài),默認(rèn)是false即可用,等于true時(shí)不可用,不能輸入內(nèi)容)
password 密碼框。(以下屬性text和password共有)
size(指定表單元素的初始寬度。當(dāng)type為text或password時(shí),表單元素的大小以字符為單位,對(duì)于其他元素,寬度以像素為單位)
maxlength(type為text或password時(shí),表示輸入的最大字符數(shù)),有利于防止sql的注入攻擊
readonly 只讀.
placeholder 框內(nèi)預(yù)置內(nèi)容(灰色),寫上內(nèi)容時(shí)才消失
radio 單選按鈕。屬性:
name(將name的值設(shè)置為相同值,才表示一組數(shù)據(jù),才能實(shí)現(xiàn)單選功能)
value(必須要寫,提交到服務(wù)器的key值,實(shí)際開發(fā)過程中value一般是編號(hào))
checked(是否被選中的狀態(tài))
checkbox 復(fù)選框。
name(名字一定要一樣一樣的,才表示是一組數(shù)據(jù),添加到同一value值列表提交到服務(wù)器)
value(必須要寫,提交到服務(wù)器的key值,實(shí)際開發(fā)過程中value一般是編號(hào))
checked(是否被選中的狀態(tài))
file 文件域,上傳文件(不同的瀏覽器表現(xiàn)形式不同)
submit 提交按鈕。用于提交表單。
reset 重置按鈕。清空表單的輸入,恢復(fù)到表單默認(rèn)的狀態(tài)。
button 普通按鈕。一般結(jié)合javascript使用。
p_w_picpath 圖片按鈕,用來提交表單,與submit是一樣的效果。
src(圖片路徑)
hidden 隱藏字段。
value(隱藏的內(nèi)容)
color 顏色標(biāo)簽。value指定顏色值(采用#十六進(jìn)制數(shù)表示)。
date 日期。value值指定默認(rèn)的日期,格式為****-**-**(年月日)。
datetime-local 顯示本地時(shí)間,value值指定默認(rèn)的時(shí)間,格式為2016-05-20T11:10:10(年月日T時(shí)分秒)。
number 數(shù)字向上或者向下滑動(dòng)。可以填數(shù)字然后向上或者向下選擇不同的值。
range 滑動(dòng)標(biāo)簽。min(指定最小值)、max(指定最大值)、value(指定當(dāng)前默認(rèn)值)。
week 每年的周數(shù)。value指定哪一年第幾周,格式為2016-W25(2016年第25周)。
<textarea> 文本域標(biāo)簽。默認(rèn)表現(xiàn)形式是可以輸入很多行文本的文本框。
name (表單提交項(xiàng)的key)
cols(設(shè)置文本域?qū)挾龋?br> rows(設(shè)置文本域高度,即行數(shù))
<select> 下拉框標(biāo)簽。使用時(shí)要結(jié)合<option>子標(biāo)簽一起使用。
name:表單提交項(xiàng)的key
size:選項(xiàng)個(gè)數(shù)
multiple:多選
<option> 下拉選中的每一項(xiàng)
value(表單提交項(xiàng)的值)
selected(selected下拉選默認(rèn)被選中)
<optgroup>為每一項(xiàng)加上分組
<label> 把元素與文本結(jié)合起來
友好設(shè)計(jì):不只是選中復(fù)選框才能選中并打鉤,要求點(diǎn)擊對(duì)應(yīng)的文字也能選中該復(fù)選框。
這種情況下要用到<label>標(biāo)簽的for屬性(設(shè)置或獲取給定標(biāo)簽對(duì)象指定到的對(duì)象,值=另一個(gè)元素的id號(hào)即可)
<label for="name">姓名</label>
<input id="name" type="text">
<fieldset> 對(duì)表單中的相關(guān)元素進(jìn)行分組
<fieldset>
<legend>溫馨提示</legend>
<div align="middle">不要忘記點(diǎn)贊哦 ==</div>
</fieldset>
value: 表單提交項(xiàng)的值
對(duì)于不同的輸入類型,value 屬性的用法也不同:
type="button", "reset", "submit" - 定義按鈕上的顯示的文本
type="text", "password", "hidden" - 定義輸入字段的初始值
type="checkbox", "radio", "p_w_picpath" - 定義與輸入相關(guān)聯(lián)的值
框架
<frameset> 框架
用來劃分窗體,不能放在<body>中,否則沒有效果。
cols (縱向分割頁面。其數(shù)值表示方法有三種:“30%、30(或者30px)、*”;數(shù)值的個(gè)數(shù)代表分成的視窗數(shù)目且數(shù)值之間用“,”隔開。“30%”表示該框架區(qū)域占全部瀏覽器頁面區(qū)域的30%;“30”表示該區(qū)域橫向?qū)挾葹?0像素;“*”表示該區(qū)域占用余下頁面空間。例如:cols="25%,200,*" 表示將頁面分為三部分,左面部分占頁面30%,中間橫向?qū)挾葹?00像素,頁面余下的作為右面部分。)
rows(橫向分割頁面。屬性和cols一樣)
frameborder(設(shè)置是否顯示框架邊框。設(shè)定值只有0、1;0 表示不要邊框,1 表示要顯示邊框)
border(框架之間的距離,一般設(shè)置為0)
bordercolor(邊框的顏色)
framespacing(設(shè)置框架與框架間的保留的空白距離)
<frameset cols="40%,*,*"> 第一個(gè)框架占整個(gè)瀏覽器窗口的40%,剩下的空間平均分配給另外兩個(gè)框架。
<frameset cols="*,*,*,*"> 瀏覽器窗口等分為四部分。
<iframe> 框架
元素會(huì)創(chuàng)建包含另外一個(gè)文檔的內(nèi)聯(lián)框架(即行內(nèi)框架)
name (設(shè)置框架名稱。此為必須設(shè)置的屬性)
src (設(shè)置此框架要顯示的網(wǎng)頁名稱或路徑。此為必須設(shè)置的屬性)
scrolling (設(shè)置是否要顯示滾動(dòng)條。設(shè)定值為auto, yes, no)
bordercolor (設(shè)置框架的邊框顏色)
frameborder (設(shè)置是否顯示框架邊框。設(shè)定值只有0、1;0 表示不要邊框,1 表示要顯示邊框)
noresize (設(shè)置框架大小是否能手動(dòng)調(diào)節(jié))
marginwidth (設(shè)置框架邊界和其中內(nèi)容之間的寬度)
marginhight (設(shè)置框架邊界和其中內(nèi)容之間的高度)
width(設(shè)置框架寬度)
height (設(shè)置框架高度)
*請(qǐng)認(rèn)真填寫需求信息,我們會(huì)在24小時(shí)內(nèi)與您取得聯(lián)系。