이 글을 작성하기까지.. 온갖 고난속에 많은 시간이 갈려나갔다. 그 이유는 독자도 경험했을지 모를 에러에 있다. 필자가 경험한 에러는 이러하다.

 

mingw_32 빌드 도중 30~40%에서 cxx 관련 에러후 실패!

qt와 OpenCV의 연동과 관련된 키워드를 구글링하면 최다조회로 mingw와 CMake를 이용한 빌드가 검색된다.

해당 게시물들을 통해 연동에 성공했으면 얼마나 좋았을까! 필자는 makefile 생성후 mingw_32로 빌드하는 과정에서 30~40% 즈음에 cxx와 관련된 원인모를 에러를 만나 좌절할수 밖에 없었다. 이에대해 makefile을 생성할때 옵션 몇개를 변경하는 방안을 제시한 블로그도 있지만 한결같은 결과만 볼수 있을 뿐이었다...

 

이외에도 여러가지 시도와 에러를 반복했지만 생략하고 고심끝에 찾아낸 연동방법을 소개하겠다.

 

OpenCV 홈페이지 : https://opencv.org/releases/

 

Releases

 

opencv.org

OpenCV 공식 홈페이지에서는 msvc15 버전으로 빌드된 파일들을 지원하기 때문에 visual studio의 경우 해당 파일을 다운받아 압축풀고 프로젝트 설정만 해주면 사용이 가능하다.

그리고 Qt Creator에서는 vs의 컴파일러를 통한 빌드를 지원한다! 즉 mingw 컴파일러를 통한 빌드가 안된다면 이미 빌드되어 올라온 msvc15 파일을 이용하면 된다. 

 

참고 : Using OpenCV with gcc and CMake — OpenCV 3.0.0-dev documentation

 

Using OpenCV with gcc and CMake — OpenCV 3.0.0-dev documentation

Result By now you should have an executable (called DisplayImage in this case). You just have to run it giving an image location as an argument, i.e.: You should get a nice window as the one shown below:

docs.opencv.org

 

1. OpenCV 홈페이지에서 빌드된 파일을 받아 압축을 푼다.

2. {압축푼 폴더}\build\x64\vc15\bin 를 환경변수에 추가한다.

3. QTCreator에서 CMakeLists.txt를 다음과 같이 수정한다.

cmake_minimum_required(VERSION 3.5) 
project(ProjectName LANGUAGES CXX) 
set(CMAKE_INCLUDE_CURRENT_DIR ON)

set(CMAKE_AUTOUIC ON)

set(CMAKE_AUTOMOC ON)

set(CMAKE_AUTORCC ON) 
set(CMAKE_CXX_STANDARD 11)

set(CMAKE_CXX_STANDARD_REQUIRED ON)

find_package(OpenCV REQUIRED) #추가

find_package(Qt5 COMPONENTS Widgets REQUIRED)

include_directories(${OpenCV_INCLUDE_DIRS}) #추가
add_executable(FID main.cpp mainwindow.cpp mainwindow.h mainwindow.ui ) 
target_link_libraries(ProjectName PRIVATE Qt5::Widgets ${OpenCV_LIBS}) #변경

위와 같이 수정후 저장하면 CMake가 모듈에 OpenCV 라이브러리를 끌어온다.

 

해당 문제는 결국 CMake를 이번에 처음 이용해봤다는점과 각종 개발툴이 자동으로 갖춰준 빌드도구에 길들여져 빌드에 대한 이해를 게을리한 결과인듯 싶다.

이참에 visual studio code를 들여야겠다는게 필자의 반성이다.

 

'공부 > Qt' 카테고리의 다른 글

Configuration failed 에러  (0) 2019.10.19
Qt 단축키  (0) 2019.07.17
Qt 란?  (0) 2019.07.17

영상을 이진화하면 객체와 배경영역을 구분할 수 있다. 하지만 객체인식을 위해선 다시 한번 객체를 구분하고 위치와 크기 등을 분석하는 작업이 필요하다. 이때 사용하는것이 레이블링 이다.

 

* 하나의 객체는 한 개 이상의 인접한 픽셀들로 이루어지며 연결된 픽셀들은 같은 레이블 번호가 할당된다.

* 레이블링에 의해 만들어지는 2차원 정수 행렬은 레이블 맵이라 불린다.

레이블 맵 행렬에서 배경픽셀은 0, 각 객체 픽셀은 고유번호가 할당된다.

* 인전합 픽셀은 연결 관계에 따라 4방향 연결성과 8방향 연결성으로 나뉜다.

* OpenCV 라이브러리 3.0.0 버전부터 관련 함수를 제공한다.

 

int connectedComponents(InputArray image, OutputArray labels, int connectivity = 8, int ltype = CV_32S);

 

image : 입력영상. CV_8UC1 or CV_8SC1. 픽셀값이 0이 아니면 객체로 간주한다. 그러므로 보통 이진화한 영상을 지정한다.

labels : 출력 레이블 맵 행렬

connectivitiy : 연결성. 4 or 8 을 지정할 수 있다.

ltype : 출력 행렬 타입. CV_32S 또는 CV_16S 를 지정할 수 있다.

반환값 : 레이블 개수(객체 개수). 0번은 배경을 나타내는 레이블이므로 실제 객체개수는 반환값-1 이다.

image : 입력영상. CV_8UC1 or CV_8SC1. 픽셀값이 0이 아니면 객체로 간주한다. 그러므로 보통 이진화한 영상을 지정한다.

labels : 출력 레이블 맵 행렬

connectivitiy : 연결성. 4 or 8 을 지정할 수 있다.

ltype : 출력 행렬 타입. CV_32S 또는 CV_16S 를 지정할 수 있다.

반환값 : 레이블 개수(객체 개수). 0번은 배경을 나타내는 레이블이므로 실제 객체개수는 반환값-1 이다.

 

* 객체 영역의 통계 정보

레이블링을 수행후 반환되는 레이블 맵에는 각 객체영역이 어느 위치에 어느 정도의 크기로 존재하는지에 대한 정보가 없다. 그러므로 OpenCV에서는 레이블맵과 통계 정보를 한꺼번에 반환하는 함수를 제공한다.

 

int connectedComponentsWithStats(InputArray image, OutputArray labels, OutputArray stats, OutputArray centroids, int connectivity = 8, int ltype = CV_32S);

 

stats : 각각의 레이블 영역에 대한 통계 정보를 담은 행렬. CV_32S

centroids : 각각의 레이블 영역의 무게 중심 좌표 정보를 담은 행렬. CV_64F

 

stats

* 행 개수는 레이블 개수와 같고 각 행은 레이블 맵의 번호와 매칭된다.(첫 번째 행은 배경 영역 정보)

* 열 개수는 항상 5개이며 각 열은 x 좌표, y 좌표, 가로 크기, 세로 크기, 레이블의 픽셀 개수 정보를 담고있다.

centroid

* 행 개수는 레이블 개수와 같고 각 행은 레이블 맵의 번호와 매칭된다.(첫 번쨰 행은 배경 영역 정보)

* 열 개수는 항상 2개이며 각 열은 레이블의 무게 중심 좌표 (x좌표, y좌표)를 저장한다.

* 무게중심좌표를 구하는 공식은 다음과 같다.

( x, y ) = ( (객체 픽셀의 x좌표를 모두 더한 값) / 픽셀 개수), (객체 픽셀의 y좌표를 모두 더한 값) / 픽셀 개수) )

'공부 > OpenCV' 카테고리의 다른 글

어파인 변환  (0) 2019.07.30
영상의 필터링  (0) 2019.07.19
영상의 연산  (0) 2019.07.19
OpenCV (Open Computer Vision)  (0) 2019.05.29

* 어파인(아핀) 변환

영상을 구성하는 픽셀의 배치 구조를 변경함으로써 평행 이동, 확대 및 축소, 회전 등 전체 영상의 모양을 바꾸는 기하학적 변환

 

* 어파인 변환 행렬

어파인 변환은 입력 영상의 좌표 (x, y)가 결과 영상의 좌표 (x', y')로 이동할때 총 여섯 개(a, b, c, d, e, f)의 파리미터를 이용한 수식으로 정의할 수 있다.

x' = f(x, y) = ax + by + c

y' = f(x, y) = dx + ey + f

위의 수식은 행렬을 이용해서 하나의 수식으로 표현 가능하다.

어파인 변환의 행렬 형태
하나의 행렬 곱셈 형태로 변환.가운데 2x3 행렬은 어파인 변환 행렬이라고 불린다.

여섯개의 원소로 정의되는 어파인 행렬을 구하기 위해서는 각 원소에 대응되는 방정식들을 구해야한다. 점 하나로부터 x 좌표와 y 좌표에 대한 변환 수식 두개를 얻을 수 있으므로 최소 점 세개에 대한 이동관계(방정식)을 알아야한다.

 

Mat getAffineTransform( const Point2f src[], const Point2f dst[] );

Mat getAffineTransform( InputArray src, InputArray dst );

 

src : 입력 영상에서 세 점의 좌표. 크기가 3인 Point2f 배열이나 vector<Point2f>

dst : 결과 영상에서 세 점의 좌표. 크기가 3인 Point2f 배열이나 vector<Point2f>

반환값 : src에 저장된 세 점을 dst 좌표의 점으로 옮기는 2x3 어파인 변환 행렬. CV_64FC1

 

- getAffineTransform 함수로 생성한 2 x 3 어파인 변환 행렬로 어파인 변환한 영상을 생성하려면 warpAffine 함수를 사용해야 한다.

 

* 어파인 변환

void warpAffine( InputArray src, OutputArray dst, InputArray M, Size dsize, int flags = INTER_LINEAR, int borderMode = BORDER_CONSTANT, const Scalar& borderValue = Scalar());

 

M : 2 x 3 어파인 변환 행렬. CV_32FC1 또는 CV_64FC1 타입이어야 한다.

dsize : 결과 영상 크기. Size()를 전달하면 입력 영상과 같은 크기의 결과 영상을 생성한다.

flags : 보간법 알고리즘. OR 연산자를 이용해 WARP_INVERSE_MAP 플래그를 지정하면 역방향으로 변환을 수행한다.

borderMode : 가장자리 픽셀 확장 방식. BORDER_TRANSPARENT를 지정하면 입력 영상의 픽셀 값이 복사되지 않는 영역은 dst 픽셀 값을 그대로 유지한다.

borderValue : borderMode가 BORDER_CONSTANT 일 때 사용할 상수 값. 기본값은 검은색.

 

- src를 어파인 변환시 어디로 이동하는지 dst에 반환하는 함수

void transform(InputArray src, OutputArray dst, InputArray m);

src : 입력 행렬 또는 vector<Point2f>. 점의 좌표를 다채널로 표현한다. ex) { Point2f(100, 20), Point2f(200, 50) };

dst : 출력 행렬 또는 vector<Point2f>. src를 어파인 변환한 위치가 담긴다.

m : 어파인 변환 행렬. 2 x 2 또는 2 x 3 실수형 행렬.

 

* 이동 변환

시프트 연산이라고도 불리며 영상을 가로 또는 세로 방향으로 일정 크기 만큼 이동 시키는 변환

 

- 입력영상의 모든 좌표를 x 방향으로 a 만큼 y 방향으로 b 만큼 이동시킨 결과좌표를 (x', y')라 할때 수식은 다음과 같다.

x' = x + a

y' = y + b 

이 수식을 행렬로 바꾸면 하나의 식으로 표현 가능하다.

수식을 행렬의 형태로 변환

이때 가운데 2x2 행렬과 뒤에 더해지는 2x1 행렬을 합치면 어파인 변환 행렬을 만들 수 있다.

이동 변환의 어파인 변환 행렬

- 해당 어파인 변환 행렬을 생성해주는 함수는 별도로 지원하고 있지 않으며

Mat M = Mat_<double>( { 2, 3 }, { 1, 0 , a, 0, 1, b} );

로 생성해서 warpAffine 함수의 매개변수로 넘겨주면 된다.

 

* 전단변환

층밀림 변환이라고도 불리며 직사각형 형태의 영상을 한쪽 방향으로 밀어서 평행사변형 모양으로 변형시키는 변환이다.

- 변환하고자 하는 픽셀이 원점(0, 0)에서 멀수록 이동거리가 길어지며 원점은 이동하지 않는다. 

- y 좌표가 증가하면 영상이 가로 방향으로 전단 변환하고

- x 좌표가 증가하면 영상이 세로 방향으로 전단 변환한다.

 

y 좌표의 증가(가로 방향 전단 변환)에 따라 m 만큼 밀릴때 전단 변환 수식과 행렬은 다음과 같다.

x' = x + m*y

y' = y

 

x 좌표의 증가(세로 방향 전단 변환)에 따라 m 만큼 밀릴때 전단 변환 수식과 행렬은 다음과 같다.

x' = x

y' = m*x + y

 

 

'공부 > OpenCV' 카테고리의 다른 글

레이블링  (0) 2019.08.16
영상의 필터링  (0) 2019.07.19
영상의 연산  (0) 2019.07.19
OpenCV (Open Computer Vision)  (0) 2019.05.29

통계학이란 모집단의 수치적 자료를 수집, 정리, 분석, 해석하여 신뢰성 있는 결론을 이끌어내는 방법을 연구하는 학문이다.

 

모집단 - 대상이 되는 구성요소의 전체집단

표본집단 - 모집단의 표본

* 금전적, 시간적, 물리적인 한계로 모집단을 연구할 수 없으므로 표본을 통해 모집단을 추론한다. 그러므로 표본이 적절치 못하면 통계학적 추론은 아무런 영항력을 가지지 못한다.

 

1차 데이터 : 연구자가 직접 데이터를 수집한 경우

2차 데이터 : 누군가에 의해 수집된 데이터

 

실용적 의의로써는 우리가 문제를 발견했을때 목적을 갖고 관련 데이터를 조사 및 수집하여 문제를 파악한후 이를 해결하기위해 데이터의 모델을 만들고 기준을 설정한후 최적의 대안을 선정할때까지 의사결정에 도움을 주는 도구이다.

그러나 통계는 어디까지나 표본집단으로 모집단을 설명할 수 있게 데이터를 효과적으로 활용하는 방법이다. 그러므로 잘못된 통계적 해석은 그럴듯한 거짓말을 만들뿐이며 이는 우리가 통계학을 배운다는것에 통계적 부산물의 심뢰성을 검증하기위한 통계적인 사고방식을 갖추는 의의를 부여한다.

 

DCOVA(Define -> Collect -> Organize -> Visualize -> Analyze) - 통계적 사고방식의 프레임워크

 

기술통계학(Descriptive statistics) - 자료가 갖는 수치적 특성을 분석해서 정보를 나타내는 방식을 다루는 학문이다.

추론통계학(Inferential statistics) - 표본집단에 의거해 모집단의 특성을 추론하기 위한 방법을 다루는 학문이다.

필터링이란 영상에서 원하는 정보만 통과시키고 나머지는 걸러내는 작업이다.

이를 통해 잡음을 걸러내어 영상을 깔끔하게 만들거나 부드러운 느낌을 걸러내서 날카로운 느낌의 영상을 만들수 있다.

 

필터링은 마스크, 커널, 윈도우, 필터 등으로 불리는 작은 크기의 행렬을 이용하는데 필터링 연산의 결과는 행렬의 모양과 원소의 값에 의해 결정되며 진한 색을 갖는 고정점을 기준 픽셀로 필터링 작업을 수행한다.

 

필터 마스크 행렬은 모든 원소 합이 1 또는 0이 되도록 설계하면 필터링 결과 영상의 평균 밝기가 입력 영상 평균 밝기와 같게 유지된다. 1 보다 작을 경우 영상의 평균 밝기가 어두워지고 1보다 크면 좀 더 밝아진다.

 

void filter2D( InputArray src, OutputArray dst, int ddepth, InputArray kernel, Point anchor = Point(-1,-1), double delta = 0, int borderType = BORDER_DEFAULT );

 

src : 입력영상

dst : 출력영상

ddepth : 결과 영상 깊이. -1을 지정하면 출력 영상의 깊이는 입력 영상과 같게 설정된다.

kernel : 필터링 마스크, 커널 이라고도 불리며 1채널 실수형 행렬

anchor : 고정점 좌표, Point(-1, -1)을 값으로 지정하면 마스크 행렬 중심을 고정점으로 사용한다.

delta : 필터링 연산 후 추가적으로 더할 값

borderType : 가장자리 픽셀 확장 방식

 

입력 영상의 깊이에 따라 지정 가능한 ddepth 값이 달라진다.

입력 영상의 깊이(src.depth()) 지정 가능한 ddepth 값
CV_8U -1 / CV_16S / CV_32F / CV_64F
CV_16U / CV16S -1 / CV_32F / CV_64F
CV_32F -1 / CV_32F / CV_64F
CV_64F -1 / CV_64F

가장자리 픽셀 처리 방법

BorderTypes 열거형 상수 설명
BORDER_CONSTANT 0 0 0 | a b c d e f g h | 0 0 0
BORDER_REPLICATE a a a | a b c d e f g h | h h h
BORDER_REFLECT c b a | a b c d e f g h | h g f
BORDER_REFLECT_101, BORDER_REFLECT101, BORDER_DEFAULT d c b | a b c d e f g h | g f e

 

* 엠보싱 필터링

-1 -1 0
-1 0 1
0 1 1

위의 행렬을 마스크값으로 지정하면 된다.

- 입력영상에서 픽셀값 변화가 적은 평탄한 영역은 결과영상 픽셀 값이 0에 가까운 값을 가지게 된다. (회색이 된다.)

- 입력영상에서 대각선 방향으로 픽셀 값이 급격하게 변하는 부분에서 결과 영상 필셀 값이 0 보다 훨씬 크거나 또는 0 보다 훨씬 작은 값을 가지게 된다. (밝거나 어두워진다)

- 음수 값은 포화연산에 의해 0이 되어버리기 때문에 결과 영상에 128을 더하는게 보기에 좋다.

 

* 블러링 필터

스무딩이라고도 불리며 뜻 그대로 영상을 부드럽게 만드는 필터링 기법이다. 입력영상에 존재하는 잡음의 영향을 제거하는 전처리 과정으로도 사용된다.

- 입력영상에서 인접한 픽셀 간의 픽셀 값 변화가 크지 않은 경우 초점이 맞지 않은 사진처럼 부드러운 느낌을 받을 수 있다.

 

* 평균값 필터

- 입력 영상에서 특정 픽셀과 주변 픽셀들의 산술 평균을 결과 영상 픽셀값으로 설정하는 필터이다.

- 평균값 필터에 의해 생성되는 결과 영상은 픽셀값의 급격한 변화가 줄어들어 날카로운 에지가 무뎌지고 잡음의 영향이 크게 사라지는 효과가 있다.

- 과도한 평균값 필터 적용은 사물의 경계가 흐릿해지고 사물의 구분이 어려워진다.

- 마스크 행렬의 크기가 커지면 커질수록 더욱 부드러운 느낌의 결과 영상을 생성한다.

- 원소 값은 1/(행의 길이 * 열의 길이) 이다.

 

void blur( InputArray src, OutputArray dst, Size ksize, Point anchor = Point(-1,-1), int borderType = BORDER_DEFAULT );

 

ksize : 블러링 커널 크기

 

* 가우시안 필터

- 평균값 필터보다 자연스러운 블러링 결과를 생성한다.

- 가우시안 분포함수로 생성한 필터 마스크를 사용하는 필터링 기법이다.

- 평균이 0이고 표준편차가 σ 인 1차원 가우시안 분포함수를 사용한다.

- 마스크 행렬의 중앙부는 비교적 큰 값을 가지며 주변부로 갈수록 0에 가까운 작은 값을 가진다.

- 필터링 대상 픽셀과 멀리 떨어져 있는 주변부에 가중치를 조금 주는것으로 가중평균을 구하는것과 같다. 마스크가 가중 평균을 구하기 위한 가중치 행렬 역할을 한다.

- 표준편차 값이 커지면 마스크 크기도 함께 커지며 연산량은 마스크 크기에 비례한다.

- 2차원 가우시안 마스크 행렬을 이용한 필터링은 1차원 가수시안 마스크 행렬과 전치행렬로 필터링한 것과 같은 결과를 얻을 수 있으며 이를 통해 연산량을 줄일 수 있다.

- CV_8U 깊이의 영상은 6σ+1 크기의 필터 마스크를 사용한다. 필터 마스크 크기를 반올림하여 만든 정수 값이 짝수이면 1을 더하여 홀수로 만든다.

 

void GaussianBlur( InputArray src, OutputArray dst, Size ksize, double sigmaX, double sigmaY = 0, int borderType = BORDER_DEFAULT );

 

sigmaX : x 방향 가우시안 마스크 표준편차

sigmaY : y 방향 가우시안 마스크 표준편차. 값이 0이면 sigmaX와 같은 값을 사용한다. sigmaX도 0 일 경우 ksize로부터 표준편차를 계산해 사용한다.

 

Mat getGaussianKernel( int ksize, double sigma, int ktype = CV_64F );

 

ksize : 마스크 크기, ksize는 0 보다 큰 홀수여야 한다.  (8*sigma+1) 보다 같거나 크게 지정하는것이 좋다.

sigma : 가우시안 표준 편차. 0 or 음수로 지정하면 0.3*((ksize-1)*0.5-1)+0.8

반환값 : ksize x 1 크기의 가우시안 필터 마스크. ksize<=7 || sigma<=0 인 경우 미리 정해놓은 커널행렬을 생성한다.

 

* 샤프닝 필터

샤프닝이란 날카로운 느낌이 나게하는 필터링 기법으로 날카로운 느낌이란 초점이 잘 맞는 사진처럼 객체의 윤곽이 뚜렷하게 구분되는것을 의미한다.

 

* 언샤프 마스크 필터

이미 촬영된 사진을 초점이 잘맞는 사진처럼 보이게끔 변경하려면 영상 에지 근방에서 픽셀 값의 명암비가 커지게 수정해야한다. 이때 사용되는 샤프닝 기법은 블러링이 적용된 날카롭지 않은 영상. 즉 언샤프를 이용하며 언샤프 마스크 필터라고 불린다.

f = 입력영상

f' = 블러링이 적용된 f

g = f-f'

h = f+g 라 할때

g는 입력영상(f) 값이 증가하기 시작하는 부근에서 음수값을 증가가 멈추는 부근에서 양수값을 가지며 입력영상(f)에서 부드러워진 입력영상(f')을 뺀. 오직 입력영상의 날카로운 성분만을 가지고 있는 함수라고 할 수 있다.

그러므로 h는 입력영상에 날카로움(에지)을 더함으로써 날카로운 성분이 강조된 최종 영상이 된다.

이때 실수 가중치를 곱한 후 더하면 날카로운 정도를 조절할 수 있다.

최종적으로 h = f+ 가중치 * g 가 되며 정리하면

언샤프를 적용하는식은 (1 + 가중치) * f - 가중치 * f' 이다.

 

void GaussianBlur( InputArray src, OutputArray dst, Size ksize, double sigmaX, double sigmaY = 0, int borderType = BORDER_DEFAULT );

언샤프에 쓰일 블러링 영상을 만들때 sigma 값을 크게할수록 과장된 느낌의 샤프닝 결과영상이 나온다.

 

* 잡음 제거 필터링

어떠한 환경에서건 촬영된 영상은 크든 작든 원치 않은 잡음을 포함할 수 있다. 이러한 잡음은 광학적 신호를 전기적 신호로 변환하는 센서에서 주로 추가된다.

 

* 잡음 모델

잡음이 생성되는 방식

 

* 가우시안 잡음 모델

보통 평균이 0인 가우시안 분포를 따르는 잡음

 

- 가우시안 분포에 따르면 전체데이터가

± σ 구간에는 67%

± 2σ 구간에는 95%

± 3σ 구간에는 99.7% 존재한다. 

 

void randn(InputOutputArray dst, InputArray mean, InputArray stddev);

dst : 가우시안 난수로 채울 행렬. 미리 할당 되어 있어야 한다. 자료형에 맞게 자동으로 포화연산이 수행된다.

mean : 가우시안 분포 평균. 0일 경우 양수와 음수가 섞여있는 난수가 발생하므로 부호 있는 자료형 행렬(CV_32S, CV_32F)을 사용해야 한다.

stddev : 가우시안 분포 표준편차. 값이 증가함에 따라 잡음의 영향이 커진다. 반대로 작을수록 잡음에 의한 픽셀 값 변화가 적다.

 

가우시안 잡음(가우시안 분포를 따르는 난수)으로 구성된 행렬을 생성해서 dst에 반환한다. 이렇게 생성된 잡음(dst)을 원본영상에 add 하면 잡음이 추가된 영상이 된다.

 

* 가우시안 필터

영상에 포함되는 대부분의 잡음은 가우시안 잡음에 속하며 이 잡음을 제거하기 위해 가우시안 필터를 사용한다.

해당 필터는 잡음제거와 함께 블러링 효과를 입히는데

픽셀 값이 크게 변하지 않는 영역(평탄한 영역)에선 블러링 되면서 잡음의 영향을 크게 줄여주지만 급격하게 변경되는 영역(에지)에선 잡음뿐만 아니라 객체의 윤곽이 흐릿해진다.

 

* 양방향 필터

잡음과 에지를 함께 제거하는 가우시안 필터의 단점을 극복하기 위한 에지 보전 잡음 제거 필터 토마시가 제안한 알고리즘이다.

 

f를 입력영상

g를 출력영상

p,q 를 픽셀의 좌표

S를 필터 크기

w를 양방향 필터 마스크 합이 1이 되도록 만드는 정규화 상수

 

f(p) 를 p점에서의 입력 영상 픽셀 값

f(p) 를 p점에서의 출력 영상 픽셀 값

G(σ) 는 표준편차가 σ인 가우시안 분포 함수

 

G(σ)(||p - q||) 를 두 점 사이의 거리에 대한 가우시안 함수 (가우시안 필터와 같은 의미로 동작)

G(σ)(|f(p) - f(q)|) 는 두 점의 픽셀 값 차이에 의한 가우시안 함수 라 할때

토마시의 양방향 필터 알고리즘

양방향 필터의 함수는 두 개의 가우시안 합수 곱으로 구성되어 있다.

 

- G(σ)(|s(p) - s(q)|) 함수는 픽셀 값이 크게 변하지 않는 영역(차이가 적은 평탄한 영역)에선 큰 가중치를

급격하게 변경되는 영역(차이가 큰 에지 근방)에선 상대적으로 0에 가까운 가중치를 할당해주므로 블러링 효과가 거의 없어 에지가 보존된다.

 

- 양방향 필터 마스크는 모든 픽셀 위치에서 주변 픽셀과의 값(밝기) 차이에 따라 고유의 마스크를 가지므로 모든 픽셀에서 서로다른 형태를 갖게된다. 그러므로 일반적인 가우시안 필터가 모든 픽셀에 같은 가우시안 마스크 필터를 사용하는것보다 많은 연산량을 필요로 한다.

 

void bilateralFilter( InputArray src, OutputArray dst, int d, double sigmaColor, double sigmaSpace, int borderType = BORDER_DEFAULT );

d : 필터링에 사용할 이웃 픽셀과의 거리. 음수를 지정하면 sigmaSpace로부터 자동 계산된다.

sigmaColor : 색 공간에서의 가우시안 필터 표준 편차. 에지를 보존할(블러링을 적용하지 않을) 밝기차의 기준점으로 

작게 지정하면 픽셀 값 차이가 큰 주변 픽셀과는 블러링이 적용되지 않지만

크게 지정하면 차이가 크더라도 블러링이 적용된다. 즉, 기준점 이상의 밝기차는 에지를 유지시킨다.

sigmaSpace : 좌표 공간에서의 가우시안 필터 표준 편차. 일반적인 가우시안 필터링에서 아용하는 표준편차와 같다. 값이 클수록 더 많은 주변 픽셀을 고려해서 블러링을 수행한다. 

 

* 미디언 필터

입력영상에서 자기 자신 픽셀과 주변 픽셀 값의 중간값을 결과영상 픽셀 값으로 지정하는 필터로 잡음 픽셀 값이 주변 픽셀 값과 큰 차이가 있는 경우(소금 & 후추 잡음. 픽셀값이 0 또는 255로 변경되는 형태의 잡음)에 효과적이다.

 

void medianBlur( InputArray src, OutputArray dst, int ksize );

src : 입력영상. 1,3,4 채널 영상을 지정할수 있으며 ksize가 3 or 5 이면 src는 CV_8U, CV_16U, CV_32F의 깊이를 가질 수 있다. 그 이상의 필터 크기에서는 CV_8U 깊이만 사용할 수 있다.

ksize : 필터크기. 3보다 같거나 큰 홀수를 지정할 수 있다. ksize * ksize 크기를 이용한다.

 

- 내부적으로 BORDER_REPLICATE 방식으로 가장자리 외곽 픽셀 값을 설정하여 필터링을 수행한다.

'공부 > OpenCV' 카테고리의 다른 글

레이블링  (0) 2019.08.16
어파인 변환  (0) 2019.07.30
영상의 연산  (0) 2019.07.19
OpenCV (Open Computer Vision)  (0) 2019.05.29

* 모든 연산은 자동으로 포화연산을 수행한다.

* 각 연산은 함수대신 연산자 재정의를 사용할 수 있지만 서로 다른 타입의 영상에 연산을 수행하려면 반드시 함수를 사용해야하고 dtype을 명시해야 한다.

 

* 영상의 덧셈

void add(InputArray src1, InputArray src2, OutputArray dst, InputArray mask = noArray(), int dtype = -1);

dst = src1 + src2;

 

src1 : 연산 대상이되는 입력 행렬 or 스칼라

src2 : 연산 대상이되는 입력 행렬 or 스칼라

dst : 연산결과를 저장할 입력 행렬과 같은 크기, 같은 채널 수를 갖는 출력 행렬. dst의 깊이는 src1, src2의 깊이와 같거나 또는 dtype에 의해 결정된다.

mask : 8비트 1채널 마스크 영상. mask 행렬 원소 값이 0이 아닌 위치에서만 연산을 수행한다.

dtype : 출력 행렬의 깊이. src1과 src2의 깊이가 같은 경우에는 dtype에 -1을 지정할 수 있고 이 경우 dst의 깊이는 src1, src2와 같은 깊이로 설정된다. src1과 src2의 깊이가 서로 다른 경우에느 dtype을 반드시 지정해야한다.

 

* 가중치를 부여한 덧셈

void addWeighted(InputArray src1, double alpha, InputArray src2, double beta, double gamma, OutputArray dst, int dtype = -1);

dst = src1*alpha + src2*beta + gamma;

 

alpha : src1 행렬의 가중치

beta : src2 행렬의 가중치

gamma : 가중한 결과에 추가적으로 더할 값

 

 

* 영상의 뺄셈

void subtract(InputArray src1, InputArray src2, OutputArray dst, InputArray mask = noArray(), int dtype = -1);

dst = src1 - src2

 

* 차영상 (차이연산, 뺄셈 연산 결과의 절대값)

void absdiff(InputArray src1, InputArray src2, OutputArray dst);

dst = | src1 - src2 |

 

* 영상의 곱셈

void multiply(InputArray src1, InputArray src2, OutputArray dst, double scale = 1, int dtype = -1);

dst = src1 * src2 * scale;

 

scale : 추가적으로 확대/축소할 비율

 

* 영상의 나눗셈

void divide(InputArray src1, InputArray src2, OutputArray dst, double scale = 1, int dtype = -1);

dst = src1 / src2 * scale;

 

* 영상의 논리 연산

입력비트 논리 연산 결
a b a AND b a OR b a XOR b NOT a
0 1 0 0 0 1
0 1 0 1 1 1
1 0 0 1 1 0
1 1 1 1 0 0

void bitwise_and(InputArray src1, InputArray src2, OutputArray dst, InputArray mask = noArray());

dst = src1 & src2;

 

void bitwise_or(InputArray src1, InputArray src2, OutputArray dst, InputArray mask = noArray());

dst = src1 | src2;

 

void bitwise_xor(InputArray src1, InputArray src2, OutputArray dst, InputArray mask = noArray());

dst = src1 ^ src2;

 

void bitwise_not(InputArray src, OutputArray dst, InputArray mask = noArray());

dst = ~src;

'공부 > OpenCV' 카테고리의 다른 글

레이블링  (0) 2019.08.16
어파인 변환  (0) 2019.07.30
영상의 필터링  (0) 2019.07.19
OpenCV (Open Computer Vision)  (0) 2019.05.29

+ Recent posts