剪裁函数python python裁剪不规则区域

OpenCV Python实现旋转矩形的裁剪

环境

创新互联公司一直秉承“诚信做人,踏实做事”的原则,不欺瞒客户,是我们最起码的底线! 以服务为基础,以质量求生存,以技术求发展,成交一个客户多一个朋友!为您提供网站制作、成都网站制作、成都网页设计、成都微信小程序、成都网站开发、成都网站制作、成都软件开发、重庆APP软件开发是成都本地专业的网站建设和网站设计公司,等你一起来见证!

矩形操作是我们在 OpenCV 里最常用的操作,其中最为常见的就是包围框( Bounding Box )和旋转矩形( Rotated Box )。 其中包围框是最为常见的,对应 OpenCV 中的 boundingRect() ,使用正矩形框处物体,一般多用在目标检测中。使用包围框框柱目标物体,这种操作比较简单,但是通常框中也会有一些其他的区域。其次就是使用旋转矩形,也叫最小外接矩形,对应 OpenCV 中的 minAreaRect() ,用来使用旋转矩形最大限度的框出目标物体,减小背景干扰,在 OCR 任务中较为常用。

minAreaRect() 返回了所需区域的最小斜矩形的参数,与包围框直接返回四个顶点的坐标不同,最小外接矩形返回的是矩形的 ((x, y), (w, h), angle) ,对应了矩形的中心,宽度,高度和旋转角度。

旋转角度 angle 是水平轴( x 轴)逆时针旋转,与碰到的矩形的第一条边的夹角。并且这个边的边长是 width ,另一条边边长是 height 。也就是说,在这里 width 与 height 不是按照长短来定义的。

在 OpenCV 中,坐标系原点在左上角,相对于 x 轴,逆时针旋转角度为负,顺时针旋转角度为正,所以函数 minAreaRect() 返回的角度范围时 [-90~0) 。想象一个平放的长矩形,调用 minAreaRect() 返回的角度为 -90 度。如果我们旋转图像,直到矩形树立起来,这是调用 minAreaRect() 得到的角度依然是 -90 度。

第一种裁剪旋转矩形的方法是通过仿射变换旋转图像的方式。

仿射变换( Affine Transformation ) 是一种二维坐标到二维坐标之间的线性变换,保持二维图形的“平直性”( straightness ,即变换后直线还是直线不会打弯,圆弧还是圆弧)和“平行性”( parallelness ,其实是指保二维图形间的相对位置关系不变,平行线还是平行线,相交直线的交角不变。)。

计算过程:

如果不做边长和角度的判断,则只会沿着 x 轴的顺时针方向做相同大小角度的旋转,不能保证旋转后的视角是正确的视角:

根据任务目标的类型,做边长和角度的判断并进行相应的调整,可以保证旋转后的视角是正确的视角:

第二种裁剪旋转矩形的方法是通过透视变换直接将旋转矩形的四个顶点映射到正矩形的四个顶点。

透视变换( Perspective Transformation )是将图片投影到一个新的视平面( Viewing Plane ),也称作投影映射( Projective Mapping )。

计算过程:

以上两种方法都可以用来抠取旋转矩形的内容。仿射变换方法需要预先对整张图进行旋转,通过观察旋转后的图像可以发现,有一部分图像被旋转出了图像边界,如果你要抠取的目标正好在图像边缘附近,那么很容易出界导致图像抠取的缺失。同时我们需要对宽、高和角度做出动态的调整;透视变换的方法直接对抠取区域进行了映射,这种方法可以省略旋转的步骤,并且不会出现抠取内容的缺失。同时我们只需要对4个顶点之间的映射关系做好定义即可,不需要考虑角度的问题。相对的,透视变换相对于仿射变换计算量更大一些,不过这在 c++ 的底层实现上带来的时延差距小于 ms 。

1.图像裁剪、加边框、旋转(Python PIL)

  日常工作中经常要用Photoshop打印一些地质图,虽然说PS有动作录制的功能,但是打印这个功能我尝试过录制动作后并未能成功运行,而且要打印的图像尺寸很多都是不同的,试了几次后就放弃了,直到后来Python学起来了,通过pywinauto库实现了这个功能,在这里就简单记录下吧。

    在写Photoshop的打印操作之前,先来回顾下打印之前的图像处理工作。

    接到的地质图多为MapGIS程序导出的jpg图片,偶尔也会有Tif格式的遥感图。对这些图像进行打印很简单,基本流程是:用PS打开图像-裁剪图像四周空白边缘-为图像四周加上3cm宽白色边框(为了美观和装订的需要)-打印。那为啥用PS来打印不直接用Windows自带打印呢,应该是打印需要用到PS特定的颜色处理模式吧,经过试验,通过两种方式打出来的色彩效果确实是不同的。

  打印前图像处理的主要目标很简单:

            1、裁剪图像四周空白

            2、为图像四周加上3cm白色边框   

下面就用Python实现它们

图像处理主要用的是PIL这个库,中途由于单位电脑比较旧(4g内存Win7 32位系统,后来重装成64位了,体验就是搞这种东西必须整个64位系统),性能不太行了,也用Opencv整了下,还是感觉PIL稍微快那么一点点,不知道是不是错觉呢。

(后来发现这两步在PS录个动作也能轻松完成(→ܫ←))

一、获取所有图片路径

    有时候要打印的图片会放在好多个不同文件夹里面,要把它们遍历出来:

import os

二、读取图片并裁剪四周空白

import PIL

获得了图像尺寸后接下来就要对图像进行边缘空白的裁剪了(其实这两步不分先后顺序的):

裁剪的思路是网上搜到的,整理下就是:

1、先把图像转成灰度模式(值变成单一的0-255以方便判断,如果要裁剪其他颜色我就不知道了,我这里只要裁掉最常见的由MapGIS导出的标准的白色边缘)。

2、分别从四个方向扫描图像,找到四个方向各自第一个灰度值不为255(最纯粹的白色(→ܫ←))的像素,记下它的坐标(i,j)。

3、通过四组坐标大小比较,得到图像除了四周空白区域外的坐标极值,也就得到了裁剪的区域左上(left,top)和右下坐标(right,bottom)。

4、利用PIL.Image.crop(),完成图像的裁剪。

5、没了,就是后来发现PIL自带这个算法,引用一下: 使用PIL裁剪图片白边

    要是用PS来做呢,‘图像-裁切-确定’就完事了。

三、给裁剪后的图像加上x厘米的白色边框

这一步主要是为了打印出来的图规范且美观。

这一步要是用PS来搞,‘图像-画布大小-设置相对的宽度和高度’ 就好了

四、判断图像是否需要旋转。

为什么要旋转这些图像呢?因为最终是要把它们用打印机打印出来,而打印机能打印的最大宽度是有限的,所以就有了这个步骤。

单位的打印机型号是惠普的HP DesignJet Z6200 60 英寸照片打印机,最大打印纸张宽度是60英寸,大约就是1524mm左右吧,除了最大尺寸外,日常还用到的纸张宽度有440、610、914、1067、1274等6、7种吧,所以出于节约打印时间和省钱的考虑,为每张图选择最合适的打印纸张宽度也是很有必要的。

判断图像是否需要旋转的思路是这样的:

1、比较图像的宽和高,判断谁是图像的长边和短边。

2、短边如果大于1524mm,这图按1:1就打不出来了,超过打印机最大可装入的纸张的宽度,把这个图像文件放到Oversize_path路径下,后续自己看着办。

3、在短边小于等于1524mm的前提下,根据对图像宽高和长短边的比较,有两种需要旋转的情况:

        3.1 如果图像的宽是长边(矮胖的矩形),且宽大于1524mm,那么这图得旋转90°;

        3.2 如果图像的高是长边(瘦高的矩形),且高小于1524mm,那么这图也得旋转90°。

*printTOtkinter()是个用tkinter搞的进度显示窗口,就输出下一些文本信息而已。

五、为图像选择最合适的打印纸张尺寸

单位打印纸有438、610、914、1524等7种宽度,现在要选出最适合的一种来进行打印。

在把短边大于1524这种情况排除之后,剩下的图像情况为短边小于1524,即单位的打印机能打印出来了。

这时要判断最佳打印用纸的宽度,有两种情况需要考虑:

1、长边>1524,改用短边来比较选择打印纸宽度。

2、长边 ≤ 1524,用长边来比较选择打印纸宽度。

下面思路就是把要用作比较的边长放入纸张宽度列表,把列表排序后找到比这个边长大一点的那个纸张宽度。

主要的步骤就是这些,再经过一顿复制粘贴完善一下其他细节之后,最后会得到一个存放打印信息的列表,把它用txt存起来,这样后面的PS批量打印需要的信息就全部搞到手了。最后放个gif。

Python reportlab 之 draw函数介绍

本节我们讲介绍一下操作canvas时经常用的工具API。在后续教程中我将会对每个工具进行详细介绍,本文把他们都介绍给大家,方便朋友们开发之用。

用line和lines方法可以直接在canvas里绘制直线段

用shape方法可以绘制复杂的形状

我们可以通过beginText函数创建text对象,然后可以通过textobject对文本进行格式化处理。最后通过drawText完成最终的绘制工作。

Path对象与Text对象十分相似,他们可以绘制更为复杂的图形(文字我们也归类的图形里)。

我们还可以使用clipPath来将一个矩形的照片剪裁成圆形的头像。

ReportLab需要使用 Python Imaging Library(PIL)来处理图片。

在ReportLab里定力两种绘制图形的方法,我们建议您采用drawImage方法,因为该方法拥有缓存机制,可以提供绘制效率。另外的方法是drawInlineImage,这个方法古老,该方法通过page stream方式存在位图,如果您反复使用一张图片,该方法每次都要重新绘制,从而造成性能低下的问题。不过如果您的照片很少而且较少使用,那么drawInlineImage方法也是非常快速的。

我们先看看古老的方法

drawInlineImage可以在canvas上绘制图片。image参数既可以是PIL对象也可以是图片的地址。ReportLab接受大部分常用图片文件格式,例如GIF或JPEG。这个函数最终返回一个 tuple(组),其中包含图片width和height

drawImage的参数和返回值与drawInlineImage基本一样。然后,drawImage却自带了缓存系统。当您第一次使用图片时,系统会将image引用存入序列中。如果您第二次使用时,系统会根据文件名取队列中查找,如果您用PIL对象,系统还会检测PIL的内容是否变更。

mask参数可帮助您创建一个透明的图形。他有个6个参数可以拥有绝对RGB那个颜色被掩盖或透明。

例如

他将使用1或0 来遮盖红色,40或41来覆盖绿色。

showPage()方法将把所有内容绘制到页面中。


分享名称:剪裁函数python python裁剪不规则区域
文章起源:http://csdahua.cn/article/dojgpeo.html
扫二维码与项目经理沟通

我们在微信上24小时期待你的声音

解答本文疑问/技术咨询/运营咨询/技术建议/互联网交流