• 제목/요약/키워드: Image Transformation

검색결과 1,076건 처리시간 0.027초

FPGA 고속병렬처리 구조의 FMCW LiDAR 신호처리 알고리즘 개발 (Development of Parallel Signal Processing Algorithm for FMCW LiDAR based on FPGA)

  • 이종헌;최지은;라종필
    • 한국전자통신학회논문지
    • /
    • 제19권2호
    • /
    • pp.335-343
    • /
    • 2024
  • 본 논문은 FMCW LiDAR의 실시간 표적 신호처리 기법에 관해 기술하고 있다. FMCW LiDAR는 높은 검출민감도를 가져 낮은 출력만으로 장거리 측정이 가능하면서도 눈, 비, 안개 등 열악한 환경에서 강건한 검출성능을 가져 자율주행자동차용 차세대 LiDAR로 주목받고 있다. 본 논문은 주파수 영역의 신호처리를 위해 필요한 고속 데이터 획득, 전송 및 병렬 신호처리를 위한 하드웨어 구조에 대해 기술하였다. 획득된 시계열 신호로부터 주파수 특성을 분석하기 위하여, 푸리에 변환 연산을 FPGA로 구현하였다. 변환된 주파수영역 데이터로부터 강건한 표적검출 성능을 확보하기 위한 C-FAR 알고리즘에 대해 기술하였다. 표적의 스펙트럼 신호로부터 주파수 측정값의 해상도를 향상하고, 측정된 주파수 값을 표적의 거리 및 속도 정보로 변환하는 과정에 대해 상세히 기술하였다. 스캐너 2D 위치 및 표적의 거리 정보를 활용하여 3차원 영상으로 변환하고 이를 전시하였다. 제안된 FPGA 구조의 병렬 신호처리 알고리즘 적용을 통하여 FMCW LiDAR의 실시간 표적 신호처리 및 고해상도 영상획득 성능을 확인하였다.

역 원근변환 기법을 이용한 터널 영상유고시스템의 원거리 감지 성능 향상에 관한 연구 (A study for improvement of far-distance performance of a tunnel accident detection system by using an inverse perspective transformation)

  • 이규범;신휴성
    • 한국터널지하공간학회 논문집
    • /
    • 제24권3호
    • /
    • pp.247-262
    • /
    • 2022
  • 국내 200 m 이상 연장의 터널에서는 CCTV 설치가 의무화되어 있으며, 터널 내 돌발 상황을 자동으로 인지한 다음 터널 관리자에게 알릴 수 있는 터널 영상유고시스템의 운영이 권고된다. 여기서 터널 내 설치된 CCTV는 터널 구조물의 공간적인 한계로 인해 낮은 높이로 설치된다. 이에 따라 이동차량과 매우 인접하므로, 이동차량과 CCTV와의 거리에 따른 원근현상이 매우 심하다. 이로 인해, 기존 터널 영상유고시스템은 터널 CCTV로부터 멀리 떨어질수록 차량의 정차 및 역주행, 보행자 출현 및 화재 발생과 같은 터널 내 유고상황을 인지하기 매우 어려우며, 100 m 이상의 거리에서는 높은 유고상황 인지 성능을 기대하기 어려운 것으로 알려져 있다. 이 문제를 해결하기 위해 관심영역 설정 및 역 원근변환(Inverse perspective transform)을 도입하였으며, 이 과정을 통해 얻은 변환영상은 먼 거리에 있는 객체의 크기가 확대된다. 이에 따라 거리에 따라 객체의 크기가 비교적 일정하게 유지되므로, 거리에 따른 객체 인식 성능과 영상에서 보이는 차량의 이동속도 또한 일관성을 유지할 수 있다. 이를 증명하기 위해 본 논문에서는 터널 CCTV의 원본영상과 변환영상을 바탕으로 동일한 조건을 가지는 데이터셋을 각각 제작 및 구성하였으며, 영상 내 차량의 실제 위치의 변화에 따른 겉보기 속도와 객체 크기를 비교하였다. 그 다음 딥러닝 객체인식 모델의 학습 및 추론을 통해 각 영상 데이터셋에 대한 거리에 따른 객체인식 성능을 비교하였다. 결과적으로 변환영상을 사용한 모델은 200 m 이상의 거리에서도 객체인식 성능과 이동차량의 유고상황 인지 성능을 확보할 수 있음을 보였다.

토양 공극 형태와 수문학적 특성에 대한 3 차원적 측정 (Three Dimensional Measurements of Pore Morphological and Hydraulic Properties)

  • 전현정;;윤성원;;;;;손연규;하상건
    • 한국토양비료학회지
    • /
    • 제43권4호
    • /
    • pp.415-423
    • /
    • 2010
  • 포어 네트웍 모델들 (Pore network model)은 토양 공극의 구조를 조사할 때 유용한 도구들이다. 이런 모델들은 삼차원 이미지들에서 공극의 구조와 관련된 양적 정보를 제공한다. 이 연구는 포어 네트웍 모델을 이용하여 공극의 구조와 수리학적 특성들을 양적으로 측정하였다. 연구목표는 큰 크기의 이미지에서 공극의 구조에 관한 양적 정보를얻기 위해 포어 네트웍 모델을 적용하고, 토양수분특성과 수리 전도도를 삼차원 이미지로부터 계산하고 이 값들은 실험을 통해 얻어진 실험값들과 결합하여 토양의 수리적 특성을 분석하는 것이었다. 토양 시료들은 발티모아 도시 중심에 있는발티모어 과학센터에 위치한 실험부지에서 채취되었다. 불교란 원주형 시료들이 채취되었고, 22 ${\mu}m$ 의 해상도로 x선 단층 촬영되었다. 포어 네트웍은 중심축 변형에 의해 공극에서 축출되었고 이를 바탕으로 공극 구조가 계산되었다. 토양수분특성과 불포화 수리 전도도 값들은 토양 이미지에서 계산 되었다. 토양 밀도, 토양수분특성과 불포화 수리 전도도들은 3 토양 시료들로부터 실험을 통해 구하였다. 삼차원 이미지 분석은 토양 공극의 특성들을, 예를 들어 공극 부피, 길이, 굴곡도, 가장 정확히 분석하였다. 이런 정확한 분석은 토양 내 수문학적 정보를 정확히 산출할 수 있게 하였다. 계산된 값과 실험을 통한 실험치의 결합은 공극에 대한 더 광범한 범위를 분석할 수 있게 하였다. 이 연구를 통해 이미지에서 계산되고 측정된 수문학적 자료들은 토양 내대기공과 소기공을 모두 다 설명해 줄 수 있는 방법이라는 것이 밝혀졌다.

주성분분석을 이용한 C[11]-PIB imaging 영상분석 (Principal component analysis in C[11]-PIB imaging)

  • 김남범;신귀순;안성민
    • 핵의학기술
    • /
    • 제19권1호
    • /
    • pp.12-16
    • /
    • 2015
  • 주성분분석(Principal component analysis, PCA)은 고차원 변수들 사이의 복잡한 상관성 구조를 더 낮은 차원으로 단순화하여 상관성의 구조를 쉽게 설명하기 위한 다변량분석기법으로 뇌영상 분석에서 자주 사용되는 방법이다. 주성분분석의 기본개념은 서로 직교하는 변수들의 선형결합을 통해서 원래의 뇌영상 자료가 가지고 있는 전체정보를 최대한 설명할 수 있는 서로 독립적인 새로운 변수들을 유도하는 것이다. 뇌영상분석에서 주성분분석의 효율성과 유용성을 알아보기 위해서 C[11]-PIB 영상을 이용하여 분석하였다. 대상 및 방법으로는 평균나이가 같은 9명의 정상인, 10명의 알츠하이머/경도인지장애환자들의 C[11]-PIB 영상을 이용하였다. PET-CT 장비로는 Biograph 6 Hi-Rez (Siemens-CTI, Knoxville, TN)를 영상을 획득하였고 9.6 MBq/kg C[11]-PIB를 정맥주사 한 후 40분 후에 20분 동안 3D acquisition mode로 방출영상을 얻었다. Attenuation map은 X-ray CT scan을 이용하여 재구성하였다(130 kVp, 240 mA). PIB template을 만들기 위해서 정상인에서 3T MRI T1-weighted 영상을 동시에 얻었다. 주성분분석을 위한전처리과정으로서 공간정규화 및 공간편평화를 SPM8을 이용하여 실시하였고 주성분분석은 Matlab2012b를 이용하여 분석하다. 결과는 주성분분석을 통해서 서로 독립적인 주성분영상들을 얻을 수 있었다. 주성분분석을 통해서 얻어진주성분영상은 C[11]-PIB brain PET 영상의 패턴을 몇 개의 주성분으로 단순화 할 수 있었으며 주로는 neocortex를 변동 나타내는 영상, white matter의 변동을 나타내는 영상 그리고 pons등 deep brain의 변동을 나타내는 영상 등으로 단순화되었다. 결론으로는 주성분분석은 C[11]-PIB brain 영상을 단순화하여 영상의 패턴을 해석하는데 매우 유용하였다. 이러한 주성분분석은C[11]-PIB영상 분석뿐만 아니라 뇌의 포도당 대사를 측정하는 FDG-PET 또는 뇌기능영상등의 다변량분석 방법으로서 그 적용범위가 클 것으로 기대된다.

  • PDF

딥러닝 기반 윤곽정보 추출자를 활용한 RPC 보정 기술 적용성 분석 (Analysis of Applicability of RPC Correction Using Deep Learning-Based Edge Information Algorithm)

  • 허재원;이창희;서두천;오재홍;이창노;한유경
    • 대한원격탐사학회지
    • /
    • 제40권4호
    • /
    • pp.387-396
    • /
    • 2024
  • 대부분의 고해상도 위성영상은 rational polynomial coefficients (RPC) 정보를 제공하여 지상좌표와 영상좌표 간 변환을 수행한다. 그러나 초기 RPC에는 기하학적 오차가 존재하여 ground control points (GCPs)와의 정합을 통해 보정을 수행하여야 한다. GCP chip은 항공정사영상에서 추출한 높이 정보가 포함된 작은 영상 패치(patch)이다. 많은 선행연구에서는 영역 기반 정합 기법을 사용하여 고해상도 위성영상과 GCP chip 간 정합을 수행하였다. 계절적 차이나 변화된 지역이 존재하는 영상에서는 화소값에 의존하는 정합이 어렵기 때문에 윤곽 정보를 추출하여 정합을 수행하기도 한다. 그러나 일반적으로 사용하는 canny 기법으로 정합에 용이한 윤곽을 추출하기 위해서는 위성영상의 분광 특성에 적절한 임계치를 설정해주어야 하는 문제가 존재한다. 따라서 본 연구에서는 위성영상의 지역별 특성에 둔감한 윤곽 정보를 활용하여 RPC 보정을 위한 정합을 수행하고자 한다. 이를 위해 딥러닝 기반 윤곽 정보 추출 네트워크인 pixel difference network (PiDiNet)를 활용하여 위성영상과 GCP chip의 윤곽맵(edge map)을 각각 생성하였다. 그 후 생성된 윤곽맵을 normalized cross-correlation과 relative edge cross-correlation의 입력데이터로 대체하여 영역 기반의 정합을 수행하였다. 마지막으로 RPC 보정에 필요한 변환모델 계수를 도출하기 위하여 data snooping 기법을 반복적으로 적용하여 참정합쌍을 추출하였다. 오정합쌍을 제거한 참정합쌍에 대해 root mean square error (RMSE)를 도출하고 기존에 사용하던 상관관계 기법과 결과를 정성적으로 비교하였다. 실험 결과, PiDiNet은 약 0.3~0.9 화소의 RMSE 값 분포를 보였으나 canny 기법에 비해 두꺼운 윤곽을 나타내어 일부 영상에서 미세하게 정확도가 저하되는 것을 확인하였다. 그러나 위성영상 내 특징적인 윤곽을 일관적으로 나타냄으로써 정합이 어려운 지역에서도 정합이 잘 수행되는 것을 확인하였다. 본 연구를 통해 윤곽 기반 정합 기법의 강인성을 개선하여 다양한 지역에서의 정합을 수행할 수 있을 것으로 예상된다.

일본의 성문화를 통해 본 포르노그래피 애니메이션의 선정성 (Pornographic Animation's Sexuality through Japanese Sex Culture)

  • 최은혜;오진희
    • 만화애니메이션 연구
    • /
    • 통권36호
    • /
    • pp.281-302
    • /
    • 2014
  • 인류는 본능적 욕구를 해소하기 위한 노력을 통해 발전을 지속해왔다. 인간의 욕구중 성욕은 식욕과 함께 가장 본능적인 것의 하나로 분류되며, 선사시대로부터 현재에 이르기까지 다양한 방식으로 표현되고 있다. 성적인 이미지 표현은 사회적, 윤리적 제약 하에서도 시대의 변화와 매체의 발전을 수용하며 더욱 앞서 진화하고 있다. 20세기 초반 사진기술의 발명으로 인해 포르노그래피 이미지는 매우 극적인 변화를 보였다. 영상은 사진보다 직접적인 이미지를 전달하는 매체로써 이러한 변화를 더욱 촉진하였고, 영상매체 중 하나로서 애니메이션은 장치에 의한 이미지인 실사영상이 가진 재현성의 한계를 넘어 실험을 거듭해왔다. 이 논문에서는 애니메이션에서 성적욕망을 어떻게 표현하고 있는가와 이를 있게 한 사회적 배경으로서의 성문화를 연결하여 논의하고자 하며, 그 분명한 사례로써 일본 포르노그래피 애니메이션을 선정하여 분석하였다. 일본 포르노그래피 애니메이션은 문화와 사회제도적 역사로부터 비롯된 결과물로써 해석되어야 한다. 헤이안시대와 에도시대를 거쳐 메이지시대 초기에 이르기까지 일본의 성문화는 매우 개방적이고 때로 파격적인 상태를 유지하였다. 일본 애니메이션에 자주 등장하는 변신, 변태, 미소년 소녀 성애, 촉수성교, 신체 특정부위의 빈번한 노출 등은 와카슈, 처방혼, 혼숙, 남색 등과 같은 고대 일본의 개방적인 성 풍습을 통해 해석할 수 있다. 이와 같은 일본 특유의 성문화는 세계 어느 곳에서도 찾아보기 쉽지 않은 일본 애니메이션 특유의 성적 표현으로 자리한다. 이러한 상황은 20세기에 이르러 2차 세계 대전의 종결과 함께 외부로부터 강제된 서구 근대화에 의해 제도적으로 단절되었다. 그렇지만 내용적으로는 현재까지도 일정한 방식으로 영향력을 지속하고 있는 것으로 보인다. 이 연구에서는 고대 일본의 자유로운 성문화가 제도에 의해 변화되는 일련의 과정을 살펴봄으로써 포르노그래피 애니메이션 또한 문화현상이라는 틀 안에서 해석되어야 함을 논의하였다. 일본 애니메이션 전반에서 발견되는 선정성은 그들의 역사로부터 비롯되며, 여성에 대한 이분법적 표현은 제도적으로 규정된 성 의식에 의해 굴절된 것으로 이해할 수 있다. 일본의 역사와 문화는 포르노그래피 애니메이션에 성적표현의 자유로움을 부여함과 동시에 타자화 된 여성 신체에 대한 두려움이자 뿌리칠 수 없는 매혹이라는 이분법으로 변형되어 드러나고 있음을 알 수 있다.

역할 창조를 위한 '몸틀(body schema)' 형성 연구 (A Study on Forming 'Body Schema' for Role Creating)

  • 송효숙
    • 한국연극학
    • /
    • 제52호
    • /
    • pp.319-357
    • /
    • 2014
  • Formation of 'body schema' is the start for actor to create role and becomes the root and the foundation of existing as a role on the stage. For this, an actor needs to form 'scheme of role' with escaping from own 'body schema.' 'Schema of role' is formed by acquiring through synthesizing daily basic actions, namely, walking, standing, sitting, hand stretching, bending, and touching. The body schema, which was made with simple and usual actions, has fundamental significance in a sense of becoming the body in which the past traces in a role are habituated while energy as a role flows. As for the process of forming body schema, an actor first needs to obtain the visualized materials like photo, magazine, picture and image available for seeing a role specifically and clearly based on what analyzed a character. An actor needs to have three-dimensional image available for always recalling it in the head during acting. To do this, image data available for fundamentally capturing routine actions along with body structure are still more useful. Next, the body schema is formed by interaction with environment. Thus, there is a need of passing through the two-time process of forming body schema. Firstly, the body schema is made on routine actions in a role as physical condition of a role in actor's own everyday life. Secondly, the body schema is made on routine actions available for moving efficiently and economically in line with the environment of performance. A theatrical stage is the temporal space of rhythm and rule different from routine space. What forms body schema immediately in the second phase without body schema in the first phase ultimately becomes what exists as actor's own body, not the body of a role. The body schema, which was formed as the second process, is what truly has identity as a role in the ontological aspect, comes to experience the oppositional force in muscle, a qualitative change in energy, and emotional agitation in the physical aspect, and experiences perception, thinking, volition, and even consciousness with the entire body in the cognitive dimension. Thus, the formation of body schema can be known to be just a method of changing even spiritual and emotional layer. Body schema cannot be made if there is no process of embodiment and habit. Embodiment and habit are not simply the repeated, empty and mechanical action in the body. But, habit itself has very important meanings for forming body schema for role creating. First, habit allows the body itself to learn and understand a meaning. Second, habit relies upon environment, thereby allowing an actor of making the habituated body schema to recognize environment. Third, habit makes the mind. The habituated body schema is just the mind and the ego of a person who possesses the body schema. Fourth, habit comes to experience the expansion in energy and the expansion in existence. It may be experienced through interrelation among actor's body, tool, and environment. Fifth, habit makes identity of the body. Hence, this just becomes what secures identity of a role. These implications of habit are the formation of body schema, which is maintained with the body of being remembered firmly through being closely connected with the process of neural adaptation. Finally, it sought for possibility of practice as one method of forming body schema for role creating through Deleuze's '-becoming' theory. As 'actual animal-becoming' is real '-becoming' of forming structural transformation in the physical dimension, it meets with what the formation of body schema pursues actuality and reality. This was explained with a concept as saying of 'all '-becoming' molecular' by Deleuze/Guattari. 'Animal of having imitated animal's characteristic- becoming' is formed by which the body schema relies upon environment. In this way, relationship among the body, tool and environment has influence even upon a change in consciousness, thinking, and emotion, thereby being able to be useful for forming body schema in a sense of possibly experiencing ultimately expansion in role, namely, expansion in existence.

선형 판별분석과 공통벡터 추출방법을 이용한 음성인식 (Speech Recognition Using Linear Discriminant Analysis and Common Vector Extraction)

  • 남명우;노승용
    • 한국음향학회지
    • /
    • 제20권4호
    • /
    • pp.35-41
    • /
    • 2001
  • 본 논문에서는 선형 판별분석 (LDA: Linear Discriminant Analysis)과 공통벡터 추출방법을 이용한 음성인식방법을 제안하였다. 음성신호는 화자의 성별, 나이, 출생지, 주위 잡음, 정신적 상태, 발성기관의 구조 등과 같은 다양한 정보를 포함하고 있다. 이로 인해 같은 음성신호라 할지라도 서로 다른 화자가 발성하게 되면 서로 다른 특성을 보이게 된다. 음성신호의 이러한 성질은 같은 음성군 (class)에 포함된 공통된 특성벡터를 추출하는 일을 상당히 어렵게 한다. 음성신호에서 공통된 특징 벡터를 추출하는 방법은 KLT (Karhunen-Loeve Transformation)와 같이 선형 대수적인 접근방법이 많이 사용되어지고 있으나, 본 논문에서는 M. Bilginer et al.이 제안한 공통벡터 추출 방법을 사용하였다. M. Bilginer et al.이 제안한 방법은 주어진 훈련 음성신호들에 대하여 최적의 공통 벡터를 추출하여 주면서 공통벡터 추출에 사용된 훈련 데이터에 대해서는 100%의 인식결과를 보여준다. 그러나 공통벡터 추출을 위한 훈련 음성신호의 수를 무한히 늘릴 수 없다는 점과 공통벡터들간의 구별정보 (discriminant information)가 정의되지 않았다는 단점이 있다. 본 논문에서는 단어그룹간 (class) 구별정보를 추출된 공통벡터와 결합해 단어간의 오인식률 (error rate)을 감소시킬 수 있는 방법과 공통벡터 추출방법에 적합한 파라미터 가공 방법을 제안하였다. 공통벡터 추출방법은 음성신호의 시간 축 정규화 방법과 벡터의 차원 크기에 따라 인식시간과 인식률에 영향을 받는다. 따라서 부적절한 시간 축 정렬과 너무 큰 벡터의 차원 수는 인식률 저하 등과 같이 알고리즘의 효율성을 떨어뜨린다. 본 논문에서 제안한 방법을 사용하여 실험한 결과 알고리즘의 효율성이 증가되었으며, 기존방법보다 약 2%정도의 향상된 인식률을 얻을 수 있었다.낮추는 효과를 나타내었다.다. 이상의 결과를 통하여 추출 온도와 용매 농도에 따른 수율의 차이가 있었으며 free radical 소거 활성에서는 종자 에탄을 추출물이 과피 에탄올 추출물 보다 145배 이상의 현저히 높은 활성을 나타내었다.을 나타내었다.'Lian(연)' : repeatability, continuance, plenty and intercommunicate, 2. 'Lian(연)'-'Lian(염)': integrity, 3. 'He (하)'-'He(화)' : peace, harmony and combination, 4. 'He(하)'-'He(하)' : clear river, 5.'He(하)'-'He(하)' ; all work goes well. When the Chinese use lotus patterns in lucky omen patterns, same pronunciation and pitch of Chinese language more prominent than natural properties or the image of Buddhism. I guess that it cause praying individual's peace and happiness more serious than philosophical meaning or symbol that base in Buddhism for ordinary people.ML., -9.00~12.49 and -19.81~19.81%, respectively). Therefore, it is concluded that the two formulations are bioequivalent for both the extent and the rate of absorption after single dose administration.ation.ion.ion.ation.ion.n. fibrosis, collagen bundle) was

  • PDF

버네사이트를 고정화한 알긴산 비드(Bir-AB)를 이용한 수용액 중 1-Naphthol의 제거 (Removals of 1-Naphthol in Aqueous Solution Using Alginate Gel Beads with Entrapped Birnessites)

  • 엄원숙;이두희;신현상
    • 대한환경공학회지
    • /
    • 제35권4호
    • /
    • pp.247-256
    • /
    • 2013
  • 본 연구에서는 페놀계 화합물의 산화-변환 반응매개체로 알려진 버네사이트를 고정화한 알긴산 겔 비드(birnessite entrapped alginate beads, Bir-AB)를 제조하고, 1-naphthol (1-NP)의 제거반응 특성을 회분식 실험을 통하여 조사하였다. SEM (Scanning Electron Microscopy)분석 결과, 버네사이트 입자는 알긴산 겔을 가교로 하여 비드에 고정화됨을 확인하였다. Bir-AB에 의한 1-NP의 제거는 유사일차 속도반응(pseudo-first order kinetic)을 따랐으며, 반응속도상수(k)는 알긴산(AG)에 대한 버네사이트(Bir) 입자의 혼합비(Bir : AG=0.25 : 1~1 : 1 w/w)가 2배 증가할 때마다 약 1.5배씩 증가하였다. Bir-AB에 의한 1-NP 제거는 pH의 영향을 받았으며 pH가 10에서 4로 감소하면서 반응속도 상수(k, $hr^{-1}$)는 0.361에서 0.661로 약 1.8배 증가하였다. 반응상등액에 대한 총유기탄소(TOC) 분석결과 Bir-AB는 버네사이트 분말입자를 사용한 경우에 비교해 상대적으로 높은 용존 유기탄소 제거 효과(74% vs 92%)를 보였으며, 반응 후 분리한 비드에 대한 탈착실험(CH3OH)과 HPLC 크로마토그램 분석 결과로부터 1-NP의 중합체 생성물은 Bir-AB에의 고정화를 통해 수용액으로부터 제거될 수 있음을 확인하였다. 또한, 반응상등액에 대한 원자흡광분석(AAS) 분석결과 반응과정에서 용출되는 Mn이온은 Bir-AB에의 재흡착을 통해 제거되었다. Bir-AB는 간단한 여과를 통해 모두 회수가능하며, 2회 재사용에 따른 1-NP의 제거효율을 평가한 결과, 초기에 비교한 큰 반응성의 감소(제거율<20%) 없이 재사용이 가능한 것으로 나타났다.

다중 레이블 분류의 정확도 향상을 위한 스킵 연결 오토인코더 기반 레이블 임베딩 방법론 (Label Embedding for Improving Classification Accuracy UsingAutoEncoderwithSkip-Connections)

  • 김무성;김남규
    • 지능정보연구
    • /
    • 제27권3호
    • /
    • pp.175-197
    • /
    • 2021
  • 최근 딥 러닝 기술의 발전으로 뉴스, 블로그 등 다양한 문서에 포함된 텍스트 분석에 딥 러닝 기술을 활용하는 연구가 활발하게 수행되고 있다. 다양한 텍스트 분석 응용 가운데, 텍스트 분류는 학계와 업계에서 가장 많이 활용되는 대표적인 기술이다. 텍스트 분류의 활용 예로는 정답 레이블이 하나만 존재하는 이진 클래스 분류와 다중 클래스 분류, 그리고 정답 레이블이 여러 개 존재하는 다중 레이블 분류 등이 있다. 특히, 다중 레이블 분류는 여러 개의 정답 레이블이 존재한다는 특성 때문에 일반적인 분류와는 상이한 학습 방법이 요구된다. 또한, 다중 레이블 분류 문제는 레이블과 클래스의 개수가 증가할수록 예측의 난이도가 상승한다는 측면에서 데이터 과학 분야의 난제로 여겨지고 있다. 따라서 이를 해결하기 위해 다수의 레이블을 압축한 후 압축된 레이블을 예측하고, 예측된 압축 레이블을 원래 레이블로 복원하는 레이블 임베딩이 많이 활용되고 있다. 대표적으로 딥 러닝 모델인 오토인코더 기반 레이블 임베딩이 이러한 목적으로 사용되고 있지만, 이러한 기법은 클래스의 수가 무수히 많은 고차원 레이블 공간을 저차원 잠재 레이블 공간으로 압축할 때 많은 정보 손실을 야기한다는 한계가 있다. 이에 본 연구에서는 오토인코더의 인코더와 디코더 각각에 스킵 연결을 추가하여, 고차원 레이블 공간의 압축 과정에서 정보 손실을 최소화할 수 있는 레이블 임베딩 방법을 제안한다. 또한 학술연구정보서비스인 'RISS'에서 수집한 학술논문 4,675건에 대해 각 논문의 초록으로부터 해당 논문의 다중 키워드를 예측하는 실험을 수행한 결과, 제안 방법론이 기존의 일반 오토인코더 기반 레이블 임베딩 기법에 비해 정확도, 정밀도, 재현율, 그리고 F1 점수 등 모든 측면에서 우수한 성능을 나타냄을 확인하였다.