• 제목/요약/키워드: 문자특징 추출

검색결과 252건 처리시간 0.027초

문자 수준 딥 컨볼루션 신경망 기반 추천 모델 (A Recommendation Model based on Character-level Deep Convolution Neural Network)

  • 기가기;정영지
    • 한국정보통신학회논문지
    • /
    • 제23권3호
    • /
    • pp.237-246
    • /
    • 2019
  • 추천 시스템의 등급 예측 정확도를 높이기 위해서는, 사용자 항목 등급 데이터뿐만 아니라 주석, 태그 또는 설명과 같은 항목의 보조 정보도 고려해야만 한다. 기존 접근법에서는 단어 단위에서 bag-of-words 모델을 사용하여 보조 정보를 모델링한다. 그러나 이러한 모델은 보조 정보를 효과적으로 활용할 수 없으므로 보조 정보를 제한적으로 이해하게 된다. 한편, 컨볼루션 신경망(CNN)에서는 보조 정보로부터 특징 벡터를 효과적으로 포착하고 추출할 수 있다. 따라서 본 논문에서는 새로운 추천 모델을 위해 딥 CNN을 행렬 분해에 통합시킨 문자 수준의 딥 컨볼루션 신경망 기반 행렬 분해 (Char-DCNN-MF) 방법을 제안한다. Char-DCNN-MF에서는 보조 정보를 더 심층적으로 이해하고 추천 성능을 더욱 향상시킬 수 있다. 실험은 세 가지 다른 실제 데이터 세트에서 수행되었으며 그 결과는 Char-DCNN-MF가 다른 비교 모델보다 유의적으로 뛰어난 성능을 보여주었다.

문자 인식을 위한 영상 복원 (Image Restoration for Character Recognition)

  • 유석원
    • 문화기술의 융합
    • /
    • 제4권3호
    • /
    • pp.241-246
    • /
    • 2018
  • 영상 기기의 기계적인 문제로 인해 실험 데이터에 발생한 잡음으로 인한 인식 오류를 최소화하기 위해서 영상복원 과정을 거친다. 영상 복원 방법은 실험 데이터를 구성하는 각각의 픽셀에 대해 Direct Neighbor와 Indirect Neighbor의 개수와 위치를 조사해서 잡음을 해결한다. 결과적으로, 영상 복원 과정을 통해 실험 데이터에 발생한 잡음을 최대한 제거하고, 영역 단위로 학습 데이터와 실험 데이터의 차이를 계산해서 잡음에 의한 인식 오류 가능성을 낮춤으로써 만족할만한 인식 결과를 얻을 수 있다.

스마트폰 사용과 MBTI 사용자 특성간의 관계 평가 (Assessing the Relationship between MBTI User Personality and Smartphone Usage)

  • 라저스리 소카세인;김경백
    • 한국빅데이터학회지
    • /
    • 제1권1호
    • /
    • pp.33-39
    • /
    • 2016
  • 최근 스마트폰 사용 형태의 도움을 받아 사용자 특성을 예측하는 것은 매우 흥미롭고 주의를 사로잡는 연주 주제이다. 현재 몇몇 연구들은 사용자의 특성을 예측하기 위해 전화 사용 기록, 문자 메시지 사용 기록, 소셜 네트워크 서비스 사용 기록 등을 이용하고 있다. 이 논문에서, 우리는 MBTI 사용자 특성과 스마트폰 사용로그 간의 관계를 평가한다. 이를 위해, 스마트폰 사용 기록에서 부터 몇몇 특징들을 추출하고 이를 Naive Bayes와 SVM등의 분류기에 적용하여 사용자의 특성을 구분하였다. 사용자 특성 분석 결과의 분석을 통해 facebook사용 기록이 외향적인 사람과 내향적인 사람을 가장 잘 구분하는 것을 알 수 있었고, SVM 분류기가 Naive Bayes보다 사용자의 특성을 잘 예측하는 것을 확인하였다.

  • PDF

메타버스 환경에서 음성 혐오 발언 탐지를 위한 딥러닝 모델 설계 (Deep Learning Model for Metaverse Environment to Detect Metaphor)

  • 송진수;딜노자;손승우;신용태
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2022년도 춘계학술발표대회
    • /
    • pp.621-623
    • /
    • 2022
  • 최근 코로나19로 인해 비대면으로 소통할 수 있는 플랫폼에 대한 관심이 증가하고 있으며, 가상 세계의 개념을 도입한 메타버스 플랫폼이 MZ세대의 새로운 SNS로 떠오르고 있다. 아바타를 통해 상호 교류가 가능한 메타버스는 텍스트 기반의 소통뿐만 아니라 음성과 동작 시선 등을 활용하여 변화된 의사소통 방식을 사용한다. 음성을 활용한 소통이 증가함에 따라 다른 이용자에게 불쾌감을 주는 혐오 발언에 대한 신고가 증가하고 있다. 그러나 기존 혐오 발언 탐지 시스템은 텍스트를 기반으로 하여 사전에 정의된 혐오 키워드만 특수문자로 대체하는 방식을 사용하기 때문에 음성 혐오 발언에 대해서는 탐지하지 못한다. 이에 본 논문에서는 인공지능을 활용한 음성 혐오 표현 탐지 시스템을 제안한다. 제안하는 시스템은 음성 데이터의 파형을 통해 은유적 혐오 표현과 혐오 발언에 대한 감정적 특징을 추출하고 음성 데이터를 텍스트 데이터로 변환하여 혐오 문장을 탐지한 결과와 결합한다. 향후, 제안하는 시스템의 현실적인 검증을 위해 시스템 구축을 통한 성능평가가 필요하다.

차량 번호판 인식 효율 향상을 위한 연구 (A Study On The Improvement Of Vehicle Plate Recognition)

  • 공용해;권춘기;김명숙
    • 한국산학기술학회논문지
    • /
    • 제10권8호
    • /
    • pp.1947-1954
    • /
    • 2009
  • 카메라에 의해 획득되는 주행 차량의 번호판 영상은 많은 변화와 잡음을 포함할 뿐만 아니라 번호판 영상내의 문자 영상은 매우 작은 크기를 가지게 된다. 이러한 열악한 조건으로 대표되는 번호판 영상의 인식 효율을 높이기 위해 번호판 영상의 인식에 적합한 영상 정제와 특징 추출 방법을 다양한 실험에 의해 결정하였으며, 서로 대비되는 특징을 사용하여 인식 성능을 상호 보완할 수 있는 인식기쌍을 설계하였다. 전체 번호판의 인식을 위해 다수의 인식기쌍으로 구성된 복합인식기를 구축하여 개별 인식 결과, 신뢰도, 상호 연관성, 저평가 요소의 처리 등을 분석하여 최종 인식하였다. 제안된 방법의 인식 효율을 도로 현장에서 취득된 번호판 영상을 대상으로 검증하였다.

랫드에서 TCDD 투여에 의해 유도된 생체독성의 고려홍삼 추출물에 의한 억제 효과 (Protective Effects of Korean Panax Ginseng Extracts against TCDD-induced Toxicities in Rat)

  • 최수진;손형옥;신한재;현학철;이동욱;송용범;이수현;강동호;임학섭;이철원;문자영
    • Journal of Ginseng Research
    • /
    • 제32권4호
    • /
    • pp.382-389
    • /
    • 2008
  • TCDD가 실험동물에 노출되었을 때 유발되는 생체독성을 예방 또는 억제할 수 있는 고려홍삼 추출물의 효과를 탐색하였다. 이를 위하여 TCDD($25\;{\mu}g/kg$ bw, 1회 투여)와 홍삼추출물(100 mg/kg bw, 격일투여)을 각각 단독 또는 병행 복강 투여한 다음 32일 동안에 체중과 각 장기들의 무게의 변화, 뇨 분석, 혈액학적 및 혈액화학적 변화를 관찰하였다. TCDD의 단독투여에 의하여 체중의 증가정도가 정상군 또는 홍삼단독 투여군의 체중증가율에 비하여 상당히 감소하였다. TCDD와 홍삼추출물을 병행 투여한 흰쥐에서의 체중증가율은 TCDD 단독투여에 의해 감소된 체중증가율을 다소 회복 시키는 결과를 나타내었다. TCDD를 단독 투여한 실험군에서는 간의 무게가 TCDD 투여 후 2, 5, 및 16일째에 대조군에 비하여 특이적으로 증가하는 특징을 보였으나, 홍삼추출물을 단독 투여한 실험군에서의 간의 무게는 대조군의 간의 무게에 비하여 다소 감소하였다. TCDD와 홍삼추출물이 병행 투여된 흰쥐에서의 간의 무게의 증가정도는 TCDD을 단독투여한 흰쥐 간의 무게에 비하여 약간 감소하였다. TCDD를 단독투여한 흰쥐에서의 신장(Kidney)의 무게는 대조군에 비하여 다소 감소하였으나 통계적으로는 유의하지 않았다. TCDD와 홍삼추출물을 병행투여한 흰쥐에서의 신장의 무게의 변화는 TCDD를 단독 투여한 흰쥐에서의 결과와 차이가 없었다. 홍삼추출물 단독 투여군에서의 신장의 무게는 실험초기(1-2일)에 대조군에 비하여 다소 감소하는 경향을 보였으나 5일 째부터는 대조군과 같은 수준으로 회복되었다. Spleen은 TCDD의 단독투여에 의해 2-3일 이내에 일시적인 감소가 있었으나 노출기간이 증가할수록 대조군 수준으로 회복되었다. 홍삼추출물단독 투여군과 TCDD와 홍삼추출물의 병행투여군에서 spleen의 무게는 대조군에 비하여 투여 후 16일 이후에는 유의적으로 증가하였다. TCDD와 홍삼추출물의 단독 또는 병행 투여군에서의 뇌의 무게는 유의적인 변화를 보이지 않았다. 실험동물 뇨에서의 specific gravity는 대조군에서 주령에 상관없이 대체적으로 1.030 이상의 수준을 유지하였으나 홍삼추출물을 단독 투여한 흰쥐에서는 투여 후 14일부터 specific gravity가 1.02 수준으로 낮아지는 경향이 나타났다. TCDD 단독 투여군에서는 투여 초기에 specific gravity가 1.02 수준으로 감소하는 경향이 있었으나 홍삼추출물을 병행투여했을때 1.02 수준으로 감소하는 경향이 14일 이후에 나타났다. 실험동물 뇨에서의 Total protein 함량은 대조군에서 전체 실험기간 동안에 $100\;{\mu}g/dL$ 수준을 유지하였으나, TCDD 단독 투여군과 TCDD와 홍삼추출물의 병행 투여군에서는 $300\;{\mu}g/dL$ 이상의 함량을 나타내는 개체수가 증가하는 현상을 보였다. 한편, 홍삼추출물 단독 투여군에서는 대조군에서와 비슷한 Total protein 함량의 수준을 나타내었다. 뇨에서 ketone body의 함량은 대조군에서 주령의 증가에 따라 높아지는 경향을 나타내었으나 실험군 간의 차이는 나타나지 않았다. Glucose, ketone, bilirubin, Occult blood, nitrite 및 urobilinogen의 함량은 모든 실험군에서 거의 유사하게 나타났으며, pH 값은 주령의 증가에 따라 높아지는 경향이 특징적이었으나 실험군간의 차이는 나타나지 않았다. 혈액화학적 검사결과 TCDD의 단독투여에 의한 AST는 대조군에 비하여 전 실험기간에 걸쳐서 전반적으로 높게 나타났으며, 특히 32일 실험군에서 가장 높은 AST 값을 나타내었다. 홍삼추출물의 단독 투여에 의한 AST는 TCDD의 단독 투여군과는 대조적으로 오히려 노출기간이 경과할수록 감소하였다. 그리고 TCDD의 투여에 의해 증가된 AST는 홍삼추출물을 병행투여 한 지 16일부터 정상 수준으로 회복되었다. TCDD를 단독 투여한 흰쥐 혈청 ALT의 활성은 16일 까지는 대조군의 ALT 활성과 비슷한 수준이었으나 32일 째에는 대조군에 비하여 상당히 증가하였다. 이에 비하여 TCDD와 홍삼추출물을 병행 투여한 실험군에서는 16일군과 32일군에서 ALT의 활성이 급격히 감소하여 대조군의 ALT 활성보다 낮게 나타났다. 홍삼을 단독 투여한 실험군에서의 ALT 활성은 전 실험기간동안에 ALT 활성에 영향을 주지 않았다.

밝기 정보를 이용한 영상 이진화에 관한 연구 (A Study on Image Binarization using Intensity Information)

  • 김광백
    • 한국정보통신학회논문지
    • /
    • 제8권3호
    • /
    • pp.721-726
    • /
    • 2004
  • 영상의 이진화는 문자 인식, 영상 분석 등 다양한 영상 처리 분야의 전처리 과정으로 자주 적용되고 있다. 영상 이진화는 임계치의 설정에 따라 처리 성능이 좌우되며, 대부분의 기존 이진화 방법은 밝기 값의 히스토그램을 사용하여 평균 밝기 값이나 히스토그램의 골짜기를 임계치로 설정한다. 이와 같은 방법은 양봉의 특징을 보이지 않거나 특정 영상을 추출하려는 경우에는 적절한 임계치를 얻기 어렵다. 따라서 본 논문에서는 그레이 스케일 영상에서 밝기 값을 여러 구간으로 분할하여 각 구간의 밝기 평균값을 구하고, 두 개의 구간에 대해 평균값 사이의 거리를 각 구간에서 평균값과 양극과의 거리 비율로 나누어서 계산된 값을 두 개의 구간을 합친 새로운 구간의 임계치로 설정한다. 최종적으로 하나의 구간이 생성될 때까지 구간 통합과 임계값 계산을 반복함으로써 이진화 임계값을 산출한다. 제안된 이진화 방법의 성능을 평가하기 위하여 다양한 종류의 영상에 적용한 결과, 기존의 이진화 방법들보다 효율적인 것을 확인하였다.

지능형 검색엔진을 위한 색상 질의 처리 방안 (Color-related Query Processing for Intelligent E-Commerce Search)

  • 홍정아;구교정;차지원;서아정;여운영;김종우
    • 지능정보연구
    • /
    • 제25권1호
    • /
    • pp.109-125
    • /
    • 2019
  • 지능형 전자상거래 검색 엔진에 대한 관심이 커지면서, 검색 상품의 특징을 지능적으로 추출하고 활용하기 위한 연구들이 수행되고 있다. 특히 전자상거래 지능형 검색 엔진에서 상품을 검색 할 때, 제품의 색상은 상품을 묘사하는 중요한 특징 중에 하나이다. 따라서 사용자의 질의에 정확한 응답을 위해서는 사용자가 검색하려는 색상과 그 색상의 동의어 및 유의어에 대한 처리가 필요하다. 기존의 연구들은 색상 특징에 대한 동의어 처리를 주로 사전 방식으로 다뤄왔다. 하지만 이러한 사전방식으로는 사전에 등록되지 않은 색상 용어가 질의에 포함된 경우 처리하지 못하는 한계점을 가지고 있다. 본 연구에서는 기존에 사용하던 방식의 한계점을 극복하기 위하여, 실시간으로 인터넷 검색 엔진을 통해 해당 색상의 RGB 값을 추출한 후 추출된 색상정보를 기반으로 유사한 색상명들을 출력하는 모델을 제안한다. 본 모델은 우선적으로 기본적인 색상 검색을 위해 671개의 색상명과 각 RGB값이 저장된 색상 사전을 구축하였다. 본 연구에서 제시한 모델은 특정 색상을 검색하는 것으로 시작하며, 검색된 색상이 색상 사전 내 존재하는 지 유무를 확인한다. 사전 내에 검색한 색상이 존재한다면, 해당 색상의 RGB 값이 기준 값으로 사용된다. 만일 색상사전 내에 존재하지 않는다면, Google 이미지 검색 결과를 크롤링하여 각 이미지의 특정 영역 내 RGB값들을 군집화하여 구한 평균 RGB값을 검색한 색상의 기준 값으로 한다. 기준 RGB값을 앞서 구축한 색상 사전 내의 모든 색상의 RGB 값들과 비교하여 각 R, G, B 값에 있어서 ${\pm}50$ 내의 색상 목록을 정렬하고, RGB값 간의 유클리디안 거리 유사도를 활용하여 최종적으로 유사한 색 상명들을 출력한다. 제안 방안의 유용성을 평가하기 위해 실험을 진행하였다. 피설문자들이 생각하는 300 개의 색상 이름과 해당 색상 값을 얻어, 본 연구에서 제안한 방안을 포함한 총 네가지 방법을 통해 얻은 RGB 값들과 피설문자가 지정한 RGB값에 대한 비교를 진행했다. 인간의 눈을 반영하는 측정 기준인 CIELAB의 유클리드안거리는 평균 13.85로 색상사전만을 활용한 방안의 30.88, 한글 동의어사전 사이트인 워드넷을 추가로 활용한 방안의 30.38에 비해 비교적 낮은 색상 간의 거리 값을 보였다. 연구에서 제시하는 방안에서 군집화 과정을 제외한 방안의 색 차는 13.88로 군집화 과정이 색 차를 줄여준다는 것을 확인할 수 있었다. 본 연구에서는 기존 동의어 처리 방식인 사전 방식이 지닌 한계에서 벗어나기 위해, 사전 방식에 새로운 색상명에 대한 실시간 동의어 처리 방식을 결합한 RGB값 기반의 새로운 색상 동의어 처리 방안을 제안한다. 본 연구의 결과를 활용하여 전자상거래 검색 시스템의 지능화에 크게 기여할 수 있을 것이다.

문서분류를 위한 의미적 주제선정방법 (Semantic Topic Selection Method of Document for Classification)

  • 고광섭;김판구;이창훈;황명권
    • 한국정보통신학회논문지
    • /
    • 제11권1호
    • /
    • pp.163-172
    • /
    • 2007
  • 웹은 전세계 규모의 네트워크로써 문자, 화상, 음성 등의 미디어 정보들을 페이지 단위로 관리되며, 링크를 이용하여 분산된 정보들을 연결하고 있다. 이러한 웹의 지속적인 발전으로 무수한 정보들을 축적하고 있으며, 그 중 텍스트로 구성된 문서들이 주를 이룬다. 사용자는 이렇게 많은 정보들 중에서 자신이 원하는 특정 정보를 찾기 위해 웹을 사용한다. 그래서 웹은 사용자 요구에 적합한 정보를 검색해 주기 위해 계속적인 시도와 많은 연구들로 발전되고 있다. 확률을 이용한 방법, 통계적인 기법을 이용한 방법, 벡터 유사도를 이용한 방법, 베이지안 자동문서 분류 방법 등 기존의 방법들은 문서의 의미적인 주제나 특징을 정확하게 처리 할 수 없어 사용자는 재검색을 해야 하는 문제점을 갖는다. 특히, 국내 문서 분류를 위한 연구는 많이 이루어지지 않아 검색에 더욱 어렵다. 이러한 문제점을 보완하기 위해 본 논문에서는 국내문서의 효율적이고 의미적인 분류를 위해 출현 개념의 TF(Term Frequency)와 주변 개념들과의 관계된 정도(RV : Relation Value)를 추출한다. 그리고 추출된 키워드들을 국내 어휘 사전인 U-WIN에 매핑하여 문서의 주제를 선택하고 본문에서 제 시하는 분류방법에 의해 웹 문서를 분류한다. 이는 문서 내 개념들의 관계를 이용하여 문서의 주제를 선정하고 문서의 의미적인 분류를 가능하게 한다.

중학교 1학년 학생의 대수적 표상 전환 및 정교화 연구 (A Study on the Transformation of Algebraic Representation and the Elaboration for Grade 7)

  • 이경림;강정기;노은환
    • 한국학교수학회논문집
    • /
    • 제17권4호
    • /
    • pp.507-539
    • /
    • 2014
  • 문자 기호 사용으로 대표되는 대수는 수학 전반에 그 영향력을 행사하는 중요한 도구로 자리매김하게 되었다. 이러한 대수를 적절히 활용하기 위해서는 무엇보다 주어진 문제 상황을 적합한 대수적 표상으로 전환하는 작업이 요구된다. 그러나 문장제에 관한 몇 가지 연구로부터 이러한 전환의 어려움이 보고되고 있다. 본 연구에서는 학생들이 주어진 문장 표상과 기하 표상 각각을 대수적 표상으로 전환 및 정교화하는 과정을 살펴보는데 초점을 두었다. 중학교 1학년 학생 29명을 대상으로 하여 문장으로 기술된 상황과 도형 표현이 추가된 상황을 제시하고 각 상황에서 요구하는 바를 대수적 표상으로 전환하는 능력을 조사한 결과 도형 표현을 대수적 표상으로 전환하는 하나의 문항을 제외하고 나머지 3개의 문항에서 10% 내외의 학생이 부적절한 응답을 하였다. 나아가 그 중 임의 추출한 네 명을 개별 면담함으로써 사고 특징 및 대수적 표상 정교화를 돕는 요인을 조사하였다. 그 결과, 대수 표상 정교화 과정은 급진적이 아닌 점진적 개선 과정임을 확인할 수 있었다. 그리고 대수적 표상 정교화를 요하는 문제에 대해 문제 요구 사항에 대한 오해가 있을 수 있음을 확인할 수 있었다. 또한 자신의 대수적 표상에 대한 설명과 구체적 수치 상황 제시가 정교화에 도움이 되는 요인으로 작용하는 것을 목격하였으며, 아울러 정교화의 경험은 전이력을 가질 수 있음을 확인할 수 있었다. 한편, 변수에 관한 오개념 등식 설정에 고착된 사고는 표상 전환의 방해 요소로 작용할 수 있음을 알 수 있었다. 이러한 결과로부터 대수적 표상 전환 및 정교화를 돕기 위한 몇 가지 교육적 시사점을 도출하였다.

  • PDF