和上一篇《python 图像处理类库 PIL (一)》一样,本文依然以图片 dog.jpeg 为例,演示 PIL Image 模块的实例接口。
1. 导入 Image 模块,打开 dog.jpeg 图片
from PIL import Image image = Image.open("dog.jpeg") 复制代码
2. 读取图片属性
2.1 宽高尺寸(像素)
width, height = image.size print("width: {} pixels\nheight: {} pixels".format(width, height)) 复制代码 width: 320 pixels height: 320 pixels 复制代码
2.2 色彩模式
mode = image.mode print("color mode: ", mode) 复制代码 color mode: RGB 复制代码
2.3 存储格式
format = image.format print("image format: ", format) 复制代码 image format: JPEG 复制代码
2.4 元信息
image.info 复制代码 {'dpi': (72, 72), 'exif': b'Exif\x00\x00MM\x00*\x00\x00\x00\x08\x00\x05\x01\x12\x00\x03\x00\x00\x00\x01\x00\x01\x00\x00\x01\x1a\x00\x05\x00\x00\x00\x01\x00\x00\x00J\x01\x1b\x00\x05\x00\x00\x00\x01\x00\x00\x00R\x01(\x00\x03\x00\x00\x00\x01\x00\x02\x00\x00\x87i\x00\x04\x00\x00\x00\x01\x00\x00\x00Z\x00\x00\x00\x00\x00\x00\x00H\x00\x00\x00\x01\x00\x00\x00H\x00\x00\x00\x01\x00\x03\xa0\x01\x00\x03\x00\x00\x00\x01\x00\x01\x00\x00\xa0\x02\x00\x04\x00\x00\x00\x01\x00\x00\x01@\xa0\x03\x00\x04\x00\x00\x00\x01\x00\x00\x01@\x00\x00\x00\x00', 'jfif': 257, 'jfif_density': (72, 72), 'jfif_unit': 0, 'jfif_version': (1, 1), 'parsed_exif': {274: 1, 282: (72, 1), 283: (72, 1), 296: 2, 34665: 90, 40961: 1, 40962: 320, 40963: 320}, 'photoshop': {1028: b'', 1061: b'\xd4\x1d\x8c\xd9\x8f\x00\xb2\x04\xe9\x80\t\x98\xec\xf8B~'}} 复制代码
3. 读取图片数据
3.1 load()
返回一个像素访问对象。像素访问对象的行为很像一个二维数组,可以通过下标 [x, y] 的方法,访问和修改像素值。通常情况下,我们不需要调用此方法,Image 类会在第一次访问图片数据时,自动调用此方法。
ps: Image.open() 是一个懒操作,在调用 load() 或其他数据访问方法前,并未读取图片数据,而仅仅读取图片的属性信息。
pix = image.load() x = image.size[0] // 2 y = image.size[1] // 2 pixdata = pix[x, y] print("pixel at ({},{}) is {}.".format(x, y, pixdata)) 复制代码 pixel at (160,160) is (184, 171, 155). 复制代码
3.2 getdata()
返回一个图像数据的序列化对象。与 load() 方法不同的是,返回序列化对象行为像一个一维数组。也就说图像的第一行后紧跟着第二行数据。可以通过 list(image.getdata()) 将其转换为普通列表。
image_data = image.getdata() if len(image_data) == image.size[0] * image.size[1]: print("length of image.getdata() is equal to the total number of pixels.") print("pixel data from 318 to 322 is ", list(image_data)[318:322]) 复制代码 length of image.getdata() is equal to the total number of pixels. pixel data from 318 to 322 is [(144, 90, 44), (144, 90, 44), (130, 78, 38), (130, 78, 38)] 复制代码
很多情况,我们希望得到关于图片数据是一个二维数组的形式,这就需要我们自己动手将 getdata() 返回的序列化对象,转化成二维数组或列表。
以下提供三种方法,同时,为了便于比较各方法的执行效率,分别打印输出了转化过程所花时间。
3.2.1 直接遍历序列化对象生成二维列表
from time import time w, h = image.size start_time = time() image_data_2d_1 = [] row = 0 for i, pixdata in enumerate(image_data): if i % w == 0: image_data_2d_1.append([]) row = i // w image_data_2d_1[row].append(pixdata) print("cost time: {} ms".format((time()-start_time)*1000)) 复制代码 cost time: 47.84393310546875 ms 复制代码
3.2.2 使用列表切片生成二维列表
getdata() 返回的序列化对象只支持整数下标,不支持切片方式访问元素,因此需要使用 list() 转换为列表。
start_time = time() image_data_list = list(image_data) image_data_2d_2 = [image_data_list[w*i:w*(i+1)] for i in range(h)] print("cost time: {} ms".format((time()-start_time)*1000)) 复制代码 cost time: 18.110036849975586 ms 复制代码
3.2.3 使用 numpy.array() 生成二维数组
numpy.array() 可以直接对 PIL 图片对象进行转化,无需调用 getdata() 方法。
import numpy as np start_time = time() image_data_2d_3 = np.array(image) print("cost time: {} ms".format((time()-start_time)*1000)) 复制代码 cost time: 0.6780624389648438 ms 复制代码
通过比较,三种转化方法所用时间 直接遍历 > 列表切片 > numpy。因此,使用 numpy 转化的效率是最高。在不导入 numpy 情况,首选使用列表切片的方式进行二维列表的转化。
3 split(): 分离颜色通道
返回一个 Image 对象元组。元组的元素为各颜色通道分离出来的单通道图片。例如,RGB 图片,返回的就是图片 R,G,B 三个颜色通过对应的灰度图。
R, G, B = image.split() R.show() G.show() B.show() 复制代码
传送门
- 上一篇 python 图像处理类库 PIL (一)
坚持写专栏不易,如果觉得本文对你有帮助,记得点个赞。感谢支持!
- 个人网站: kenblog.top
- github 站点: kenblikylee.github.io
参考文献:K码农-http://kmanong.top/kmn/qxw/form/home?top_cate=28
本文暂时没有评论,来添加一个吧(●'◡'●)