• 제목/요약/키워드: abstract machine

검색결과 117건 처리시간 0.022초

내용기반의 인쇄체 영문 문서 영상 검색을 위한 특징 기반 단어 검색 (A Feature -Based Word Spotting for Content-Based Retrieval of Machine-Printed English Document Images)

  • 정규식;권희웅
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제26권10호
    • /
    • pp.1204-1218
    • /
    • 1999
  • 문서영상 검색을 위한 디지털도서관의 대부분은 논문제목과/또는 논문요약으로부터 만들어진 색인에 근거한 제한적인 검색기능을 제공하고 있다. 본 논문에서는 영문 문서영상전체에 대한 검색을 위한 단어 영상 형태 특징기반의 단어검색시스템을 제안한다. 본 논문에서는 검색의 효율성과 정확도를 높이기 위해 1) 기존의 단어검색시스템에서 사용된 특징들을 조합하여 사용하며, 2) 특징의 개수 및 위치뿐만 아니라 특징들의 순서를 포함하여 매칭하는 방법을 사용하며, 3) 특징비교에 의해 검색결과를 얻은 후에 여과목적으로 문자인식을 부분적으로 적용하는 2단계의 검색방법을 사용한다. 제안된 시스템의 동작은 다음과 같다. 문서 영상이 주어지면, 문서 영상 구조가 분석되고 단어 영역들의 조합으로 분할된다. 단어 영상의 특징들이 추출되어 저장된다. 사용자의 텍스트 질의가 주어지면 이에 대응되는 단어 영상이 만들어지며 이로부터 영상특징이 추출된다. 이 참조 특징과 저장된 특징들과 비교하여 유사한 단어를 검색하게 된다. 제안된 시스템은 IBM-PC를 이용한 웹 환경에서 구축되었으며, 영문 문서영상을 이용하여 실험이 수행되었다. 실험결과는 본 논문에서 제안하는 방법들의 유효성을 보여주고 있다. Abstract Most existing digital libraries for document image retrieval provide a limited retrieval service due to their indexing from document titles and/or the content of document abstracts. This paper proposes a word spotting system for full English document image retrieval based on word image shape features. In order to improve not only the efficiency but also the precision of a retrieval system, we develop the system by 1) using a combination of the holistic features which have been used in the existing word spotting systems, 2) performing image matching by comparing the order of features in a word in addition to the number of features and their positions, and 3) adopting 2 stage retrieval strategies by obtaining retrieval results by image feature matching and applying OCR(Optical Charater Recognition) partly to the results for filtering purpose. The proposed system operates as follows: given a document image, its structure is analyzed and is segmented into a set of word regions. Then, word shape features are extracted and stored. Given a user's query with text, features are extracted after its corresponding word image is generated. This reference model is compared with the stored features to find out similar words. The proposed system is implemented with IBM-PC in a web environment and its experiments are performed with English document images. Experimental results show the effectiveness of the proposed methods.

들뢰즈와 가타리의 리좀적 탈주 표현 연구 -송하영 회화·오브제작품을 중심으로- (A Study on the Expressions of Rhizomatic Escape by Deleuze and Guattari - Song Hayoung With a focus on paintings and objet works -)

  • 송하영
    • 문화기술의 융합
    • /
    • 제7권4호
    • /
    • pp.325-330
    • /
    • 2021
  • 연구자의 작품에 투영되어 있는 탈주체의 형상과 속성, 그리고 탈주 방식 등을 들뢰즈와 가타리가 사회 변혁의 방식으로 제시한 리좀적 사유에 연결시켜 살펴보고, 그것이 사회적으로 어떠한 의미를 내포하고 있는지 밝혀보았다. 연구자의 작품에 투영된 탈주체는 어떤 완성체가 아니며 언제나 변화와 생성을 전제하고 있는 질료와 같은 것이다. 이 탈주체는 유·무의식적 욕망이 존재한다. 이 욕망은 들뢰즈와 가타리가 모순된 사회 변화를 추구하는 등의 긍정적 속성을 지닌 생성의 욕망이다. 탈주체에 이 욕망을 배치하게 되면 탈주을 감행한다. 이 탈주 방식은 들뢰즈와 가타리가 제시한 리좀적이다. 이것은 모순된 것을 해체하고, 외부와의 연결·접속과 단절을 반복하면서 새로운 질서를 생성한다. 작품에 등장하는 리좀적 탈주체는 반복적 붓질을 한 색면과 결합된 오브제를 가변 설치하여 탈주하는 과정과 방식을 추상적으로 표현한 것이다. 이 작품에서 탈주하는 탈주체들의 목표는 존재자들의 가치와 자유롭고 창조적인 삶을 인정하는 공간으로 안전하게 착륙하는 것이다. 이 탈주체들은 드넓은 초원을 유동하면서 끊임없이 새로운 풍경을 생성하는 노마드이며, 모순된 사회에 저항하는 예술가, 문학가, 즉 들뢰즈와 가타리가 사회 변혁의 개념으로 제시한 전쟁기계와 거리의 열정을 만들며 새로운 가치와 정치를 창안·창조하는 니체의 아곤 개념과 연결된다. 이들이 추구하는 것은 기존 질서를 완전 해체하는 것이 아니며, 타자성을 인정하는 가운데 공존할 수 있는 공간을 희망한다.

챗GPT 등장 이후 인공지능 환각 연구의 문헌 검토: 아카이브(arXiv)의 논문을 중심으로 (Literature Review of AI Hallucination Research Since the Advent of ChatGPT: Focusing on Papers from arXiv)

  • 박대민;이한종
    • 정보화정책
    • /
    • 제31권2호
    • /
    • pp.3-38
    • /
    • 2024
  • 환각은 대형언어모형이나 대형 멀티모달 모형의 활용을 막는 큰 장벽이다. 본 연구에서는 최신 환각 연구 동향을 살펴보기 위해 챗 GPT 등장 이후인 2022년 12월부터 2024년 1월까지 아카이브(arXiv)에서 초록에 '환각'이 포함된 컴퓨터과학 분야 논문 654건을 수집해 빈도분석, 지식연결망 분석, 문헌 검토를 수행했다. 이를 통해 분야별 주요 저자, 주요 키워드, 주요 분야, 분야 간 관계를 분석했다. 분석 결과 '계산 및 언어'와 '인공지능', '컴퓨터비전 및 패턴인식', '기계학습' 분야의 연구가 활발했다. 이어 4개 주요 분야 연구 동향을 주요 저자를 중심으로 데이터 측면, 환각 탐지 측면, 환각 완화 측면으로 나눠 살펴보았다. 주요 연구 동향으로는 지도식 미세조정(SFT)과 인간 피드백 기반 강화학습(RLHF)을 통한 환각 완화, 생각의 체인(CoT) 등 추론 강화, 자동화와 인간 개입의 병행, 멀티모달 AI의 환각 완화에 대한 관심 증가 등을 들 수 있다. 본 연구는 환각 연구 최신 동향을 파악함으로써 공학계는 물론 인문사회계 후속 연구의 토대가 될 것으로 기대한다.

한국초록집의 특성 (Some General Characteristics of the Abstracting Journals Published in Korea)

  • 최성진
    • 한국비블리아학회지
    • /
    • 제7권1호
    • /
    • pp.5-22
    • /
    • 1994
  • 1984년에 발행된 本誌 第6輯에 필자는 당시의 한국초록서비스의 技術現況에 대하여 조사한 결과를 발표한 바 있다. 그로부터 10년이 지난 금년에 필자는 다시 類似한 範圍와 內容의 조사를 행하여 한국초록서비스의 變化 또는 발전의 實相을 밝혀 보려고 한다. 금년 조사의 실제적 意圖는 초록서비스의 주요 道具인 이 나라 초록지의 발전과정을 10년이라는 비교적 긴 기간에 걸쳐서 觀察하고 그 持續的 특성이 어떤 것인지를 定義하려는 데 있다. 한 나라 초록지의 일반적 특성을 어느 해에 實行한 한번의 조사결과에 기초하여 定義하기는 어렵다. 韓國抄錄서비스의 기술현황을 조사한 결과 부분은 금년 여름 "한국문헌정보학회지" 발표하였으므로(최성진, 1994) 여기서는 지난 10년 동안에 관찰된 한국초록지의 일반적 특성에 대해서만 制限的으로 살펴보려고 한다. 그러나 本稿의 論議가 대부분 위의 記事와 같은 資料에 根據한 것이므로 그것을 참고하면 이해에 도움이 될 것이다. 硏究開發投資가 해마다 증가하여 최근 한국에는 많은 연구보고문헌 이 생산 축적되고 있지만 그것을 각분야 연구자와 기술자들에게 신속히 알려서 효과적으로 이용하게 해야 할 초록지는 그 種數도 적고 내용 또한 贊弱한 형편이다. 한국초록지의 내용을 충실히 하고 이용자 들에게 硏究速報媒體로서 더 유용하게 하려면 먼저 그 일반적 특성이 어떤 것이며 長點과 短點은 어떤 것인지를 定義할 필요가 있다. 本稿는 그러한 定義를 試圖하려는 것이다. 情報奉仕는 그것을 출현시킨 국가의 전통과 관습에 따라 조금씩 다른 모양으로 발전한다. 결과적으로 각국의 정보봉사나 그 도구인 초록지의 형태에도 多少間에 差異가 나타난다. 本稿는 그러한 觀點에서 世界의 普遍的 抄錄誌 形態에서 벗어나는 韓國抄錄誌의 特性을 밝히는 데 論議를 集中시키려고 한다.

  • PDF

특허문서 필드의 기능적 특성을 활용한 IPC 다중 레이블 분류 (IPC Multi-label Classification based on Functional Characteristics of Fields in Patent Documents)

  • 임소라;권용진
    • 인터넷정보학회논문지
    • /
    • 제18권1호
    • /
    • pp.77-88
    • /
    • 2017
  • 최근 지식과 정보가 가치를 생산하는 지식기반사회로 접어들면서 지식재산권의 대표적인 형태인 특허에 대한 중요성이 매우 높아지고 있으며 출원되는 특허의 양도 매년 증가하고 있다. 방대한 양의 특허정보를 효과적으로 이용하기 위해서 특허문서를 그 발명의 기술적 주제에 따라 적절하게 분류하는 것이 필요하며 이를 위해 IPC(International Patent Classification)가 주로 사용되고 있다. 현재 주로 사람의 손으로 이뤄지는 특허문서의 IPC 분류과정의 효율성을 높이기 위하여 다양한 데이터마이닝과 기계학습 알고리즘을 기반으로 IPC 자동분류에 관한 연구들이 수행되어 왔다. 하지만 기존의 IPC 자동분류에 관한 연구의 대부분은 특허문서의 구조적 특징과 같은 특허문서 고유의 데이터 특성에 대한 고려보다는 다양한 기계학습 알고리즘을 특허문서로 적용하는 것에 초점을 맞춰왔다. 이에 본 논문에서는 IPC 자동분류를 위해 특허문서의 특징과 구조적 필드의 역할을 기반으로 특허문서 분류에 영향을 끼치는 두 가지 필드, 기술분야 및 배경기술 필드의 활용을 제안한다. 그리고 특허문서가 동시에 다수의 IPC 분류코드를 가지는 점을 반영하여 다중 레이블 분류(multi-label classification) 모델을 구축한다. 또한 IPC 다중 레이블 분류의 실제 현장에서의 적용 가능성 확인을 위해 630개의 범주를 가지는 IPC 서브클래스 레벨까지 분류 가능한 수법을 제안한다. 이를 위해 국내에서 등록된 564,793건의 특허문서를 대상으로 특허문서의 구조적 필드의 영향을 확인하기 위한 IPC 다중 레이블 분류 실험을 수행하였고, 그 결과 제목, 요약, 청구항, 기술분야 및 배경기술 필드를 활용한 실험에서 87.2%의 싱글매치 정확도를 얻었다. 이를 통해 기술분야 및 배경기술 두 필드가 IPC 서브클래스 레벨까지의 다중 레이블 분류의 정확도를 향상시키는데 중요한 역할을 하고 있음을 확인하였다.

휴리스틱 함수를 이용한 feature selection에 관한 연구 (Research about feature selection that use heuristic function)

  • 홍석미;정경숙;정태충
    • 정보처리학회논문지B
    • /
    • 제10B권3호
    • /
    • pp.281-286
    • /
    • 2003
  • 실생활에서 해결하고자 하는 문제에 대해 수많은 feature들이 수집되어지나 그 feature들을 모두 문제 해결에 활용하는 것은 어렵다. 모든 feature들에 대한 정확한 자료의 수집이 어려우며 관련된 feature들을 모두 학습에 이용할 경우 복잡한 학습 모델이 생성되어지며 좋은 수행 결과도 얻을 수 없다. 또한 수집된 자료들 간에는 상호 관계나 계층적 관계가 존재하는데, 경험적 지식이나 통계적 방법을 이용하여 feature들간의 관계를 분석함으로써 feature의 수를 줄일 수 있다. 휴리스틱 기법은 반복적인 시행 착오와 경험을 통한 학습으로써 미래가 불확실하고 완전한 정보를 갖고 있지 못할 때, 인간의 사고 기능을 통하여 기억이나 경험을 살려, 스스로 해결방안을 모색하면서 점차로 해에 접근해 가는 방법이다. 전문가들은 경험에 의한 의견 수렴 과정을 거쳐 해당 문제 영역에 접근 가능하며, 이러한 특성을 학습에 사용될 feature의 수를 줄이는데 활용할 수 있다. 전문가들은 원시 자료들을 이용하여 새로운 feature들을 생성할 수 있다 새로이 산출된 feature들과 원시 데이터 내의 feature들을 혼합하여 학습 모델 생성에 이용한다. 본 논문에서는 휴리스틱 함수를 이용하여 학습에 사용될 feature의 수를 줄이고, 추출된 feature들을 신경망의 입력값으로 사용하는 기계 학습 모델을 제시한다. 모델의 성능 평가를 위해 프로야구 경기의 승패 예측 문제를 이용하였다. 실험 결과는 신경 회로망과 휴리스틱 모델을 단독으로 사용했을 때 보다 두 기법을 혼합한 모델이 신경 회로망의 복잡성을 감소시킬 뿐 아니라 분류(classification)의 정확성이 향상되었다.아니라 Hep G2 세포에서도 명백히 단백질의 발현을 관찰할 수 있었다. 또한, Hep G2와 COS세포 모두에서 endogenous RXR의 발현이 일어남을 확인하였고 RXR expression plasmid를 transfection시켰을 때 두 세포 모두에서 단백질의 발현이 현저하게 증가되었다. Constitutive Androstane Receptor (CAR)에 의한 CYP2B의 PBRU 활성효과를 다르게 분화된 세포에서 차이가 일어나는지를 비교하기 위하여 CAR에 의해 매개되는 PBRU의 transactivation효과를 Hep G2와 COS세포에서 조사하였다. Hep G2 세포에서는 transfection된 CAR의 발현에 의해 firefly luciferase 보고단백질의 활성이 약 12배 증가하였다. CAR 발현유전자를 15 ng transfection하였을 때 주어진 보고유전자의 양에 대하여 최대반응을 나타내었고 CYP2B1PBRU가 제거된 CYP2C1 promotor/firefly luciferase를 보고유전자로 사용하였을 때는 CAR에 의한 luciferase의 활성이 나타나지 않았다. Hep G2와는 달리, COS세포에서는 transfection된 CAR의 발현이 PBRU에 의한 firefly luciferase보고단백질의 발현에 영향을 주지 못하였다. 이러한 결과들은 분화된 세포의 종류에 따라서 constitutive androstane receptor의 CYP2BPBRU 활성효과가 다르게 나타날 수 있음을 제시할 뿐만 아니라, 간세포에서 Phenobarbital에 의한 PBRU의 활성유도에 영향을 주는 endogenous 매개 인자들 중 CAR와 RXR과는 다

편물의 역사적 고찰 -유럽의 편물 전통문양을 중심으로 - (The Historical Survey on Knitted Works - On the Basic of the Traditional Knitting Patterns of Europe -)

  • 이순홍;이선명
    • 복식
    • /
    • 제50권7호
    • /
    • pp.195-218
    • /
    • 2000
  • This study investigates the characteristics of European knitted works from a historical perspective. Specifically, this study deals with the following research topics: 1) the origin and development of knitting. 2) the characteristics of knitting industry according to the change of times, 3) the comparison of local knitting patterns and cultures. 4) 7he symbolic meaning of the designs in the knitted works and theire functions. This research is barred on the survey of the relevant literature and photographs. The results of the study are summarized as follows. 1) The introduction of knitted works was closely connected with the climatic and socio-economic conditions of the places of the origin. Knitted work developed mostly in Northern Europe, a cold area, and the barren, mountainous coastal areas where people frequently used woolen materials for clothes. 2) In ancient times, abstract and geometric patterns have developed in Europe under the influence of Arabian knitted work. Middle Ages saw the flourishing of Arabian knitted works representing the authority of the church. In early modern times, the knitted work assumed the wealth of the royal families and the nobles. But afterward it was gradually Popularized among the middle classes. Knitting was then regarded as one of the women's major cultural activities. However, recently in the interwar periods. the knitting industry did not flourish and the knitted works came to serve merely as comfort goods by political urge. Knitted works were introduced in Korea around 1870 (the 7th or 8th year of king Kojong era) by Catholic missionaries and they started to be made by machine in 1917. 3) As for the propagation of the knitted work into Europe, there are three routes estimated. The traditional knitting patterns of local areas and their characteristics are summed up as follows : (1) England Guernseys are thick dark blue wool, whereas Jerseys are thinner and of various colors. The knitted shawls of Shetland are world-famous for their fine, lace-like texture that they can be through a wedding-ring. The knitted work of Fair Isle shows several distinctive features, such as the use of no more than two colors, patterns with diagonal lines. symmetry within the patterns, the prominent OXO patterns, and horizontal bands of patterning. The representative knitted work of Aran is Aran sweater made for fishermen to developed from guernseys of Scotland. (2) Scandinavian countries are distinguished from other countries by their conservative but creative cultural tradition. Their knitting patterns are characterized by small geometric figures such as dots, triangles, squares, rhombuses, and crosses used often with stars and roses. Scandinavian knitting is also salient for its vertical stripes and simple motifs repeating at short intervals. (3) Baltic area : The Latvian and Lithuania stockings have very ornate patterns. Many of the Estonian knit stockings and mittens share designs. Komi was well-known for its symmetric diamond pattern. Komi patterns include colored stripes, borders of pattern and all-over designs of complex diagonals. (4) Balkan area : In Yugoslavia, the patterns of roses, leaves and flowers were used for stockings, gloves and leggings. Greek knitting resembled southern Russian knitting, which utilized light colored patterns with dark colors for a background. Turkish patterns are symmetric vertically or horizontally. 4) The traditional knitting patterns net only carried symbolic meanings but also served as means of communication. First of all, patterns had incantatory meanings. Patterns also represented Power or authenticity Patterns were symbolic of one's social standing, too. The colors, motifs and their arrangements were very important features symbolizing one's social position or family line. People often communicated by certain pieces of knitted work or patterns.

  • PDF