• 제목/요약/키워드: Document Classification

검색결과 448건 처리시간 0.033초

한국 전통음식 통합검색 시스템 개발에 관한 연구 (A Study on the Development of a Korean Traditional Food Data Integration System)

  • 신승미
    • 한국식품영양학회지
    • /
    • 제21권4호
    • /
    • pp.545-552
    • /
    • 2008
  • This study is attempt to develop for Korean traditional food data integration system with food database. We are collected all kinds of traditional Korean foods, and referred to document and classified according to food types and cooking methods. Also we are classified 6 types of traditional Korean foods as follows: traditional common, royal, local, festival, rites, and Buddhist temple foods, And we integrate all of that databases for using a specialist or not. We researched for Korean traditional food by cooking type and planed organization for the standardized code and construction for database of Korean traditional foods. It was combined all of them, constructed for Korean traditional food data integration system. Korean traditional foods are classified with 10 provinces local foods, 18 festival foods by seasonal divisions reflecting traditional Korean holidays; and 9 classes rites foods. Korean traditional food using a traditional Korean food classification system was investigated a total of 7,289 kinds foods according to food types. those were 2,585 kinds traditional common foods, 142 kinds of royal foods, 2,137 kinds of local foods, 515 kinds of festival foods, 403 kinds of rites foods, and 1,507 kinds of Buddhist temple foods. And Korean traditional foods included 980 kinds of main dishes, 4,456 kinds of side dishes, 873 kinds of tteok lyou, 515 kinds of hangwa lyou and 465 kinds of emchong lyou. It is therefore recommended that knowledge of traditional Korean foods be preserving and develop their excellence and to further studies.

설계 프로세스를 반영한 BIM 작성 기준(LOD)에 대한 연구 (A Study of LOD(Level of Detail) for BIM Model applied the Design Process)

  • 조현정;김연수;마영균
    • 한국BIM학회 논문집
    • /
    • 제3권1호
    • /
    • pp.1-10
    • /
    • 2013
  • BIM(Building Information Modeling) ordering manuals and guidelines are diffused with the recent BIM activation. However, it is causing drawbacks such as an increase of work at each design stage and a decline of BIM application level that the standard of making up and managing BIM is vague and it includes comprehensive meaning. Therefore, this study aims to secure BIM work standard by establishing BIM making-out standard based on LOD(Level of Detail) classification considering domestic design process. It compared each definition of LOD by analyzing domestic and foreign BIM guideline examples, and figured out insufficiency of existing domestic and foreign design process and BIM guidelines. Moreover, it drew architects' work articles for promoting the progression of the efficient design process, and analyzed BIM requirements on design process, dividing BIM application scale by field. Through this analyzing process, it finally established BIM making-out standard classified by design process. The effects of establishing BIM making-out standard would include improving a division of labor and cooperation environment by creating integrated BIM model on design stages, advancing work efficiency by preventing a repetition and an increase of work, and upgrading project completeness and design quality. Besides, it can secure BIM work standard by clarifying responsibility for working steps. BIM making-out standard established by this study will contribute to developing the future BIM work standard document and BIM guideline as a data base.

복수의 신문기사 자동요약에 관한 실험적 연구 (An Experimental Study on Automatic Summarization of Multiple News Articles)

  • 김용광;정영미
    • 정보관리학회지
    • /
    • 제23권1호
    • /
    • pp.83-98
    • /
    • 2006
  • 이 연구에서는 복수의 신문기사를 자동으로 요약하기 위해 문장의 의미범주를 활용한 템플리트 기반 요약 기법을 제시하였다. 먼저 학습과정에서 사건/사고 관련 신문기사의 요약문에 포함할 핵심 정보의 의미범주를 식별한 다음 템플리트를 구성하는 각 슬롯의 단서어를 선정한다. 자동요약 과정에서는 입력되는 복수의 뉴스기사들을 사건/사고 별로 범주화한 후 각 기사로부터 주요 문장을 추출하여 템플리트의 각 슬롯을 채운다. 마지막으로 문장을 단문으로 분리하여 템플리트의 내용을 수정한 후 이로부터 요약문을 작성한다. 자동 생성된 요약문을 평가한 결과 요약 정확률과 요약 재현율은 각각 0.541과 0.581로 나타났고, 요약문장 중복률은 0.116으로 나타났다.

Web에서의 협력 환경 구축 방안 연구 (A Study on the Construction Method of Collaboration Environment for Web)

  • 이재호
    • 정보교육학회논문지
    • /
    • 제1권1호
    • /
    • pp.74-81
    • /
    • 1997
  • 현재 World Wide Web (이하 Web) 자체를 일반 사용자들이 인터넷으로 인식하고 있는 상황에서 잘못된 정보의 전달은 매우 큰 문제이며, 이것은 존재하는 정보를 잘못 가공하는 데에서 기인하게 된다. 잘못 가공된 정보의 전달을 방지하는 방법으로 여러가지가 있으나, 이중 가장 대표적인 것으로 인식되는 것이 바로 CSCW이다. CSCW 환경은 클라이언트-서버 환경과 같은 단일 시스템에서의 공동 작업 공간을 다중의 사용자에게 제공하여 주는 것으로 인터넷 또는 인트라넷 환경과 같은 분산 공유 정보 시스템 환경 즉, 다중의 이질적인 시스템과 다중 사용자 환경에서 사용시는 다수의 추가적 요소를 필요로 하게 된다. 이러한 문제점을 해결하려는 것이 협력으로 폐쇄적인 인터넷인 인트라넷에서의 이질적인 전산환경 특히, 교육, 생산, 마케팅 분야 및 정부에서 사용시 많은 이점이 있다. 본 논문에서는 현재 협력의 골격이 되는 CSCW, 그룹 웨어등의 개념을 먼저 살펴보고, 다음으로 협력의 정의와 분류, 문제점 분석, 그리고 Web에서의 협력 환경 구축 방안에 대하여 기술하겠다.

  • PDF

이안천의 식생분포 (Distribution of riparian vegetation in Ian Stream)

  • 김호준;이혜근;최광순
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2005년도 학술발표회 논문집
    • /
    • pp.1274-1279
    • /
    • 2005
  • The complex vegetation and plant species distributions within riparian corridors influence plant species diversity patterns at both local and regional scales and further reflect both natural and anthropogenic disturbances. Because of these characteristics, riparian zones are often the ecosystem level component that are most sensitive to changes of the surrounding environment; they provide early indications of environmental change and can be viewed as the important source in the watershed. The objectives of this study were two concepts: first, document the composition and dominance of plant communities of riparian areas in the stream, second, compare species composition and temporal diversity between stations in riparian areas of the Ian Stream. The flora was composed to total 158 kinds of the vascular plants as 49 family, 54 genera, 145 species, 12 varieties, 1 forma When the naturalized plant were applied to the recent classification system 280 kinds, the naturalization rate was $10.8\% higher than that of mean value($10.3\%$) of the Korean mountain district. Furthermore, urbanization index (UI) was $6.1\%$. The dominant vegetation communities were distributed in the habitats of three compartments from upstream to downstream. The vegetations were included Phragmites japonica, Salix gracilistyla, S. hulteni and Robinia pseudo-acacia in the riparian area, and Persicaria sieboldii, Stellaria alsine var. undulata, Draba nemorosa var. hebecarpa, Capsella bursa-pastoris, Lepidium apetalum, Bidens frondosa, Trigonotis peduncularis and Hemistepta lyrata in the sandbank or the riparian area, and Equisetum arvense, Humulus japonicus, Persicaria perfoliata, Trifolium repens, Artemisia princeps var. orientalis, Lactuca indica var. laciniata, Avena fatua, Agropyron yesoense, Oenothera odorata, Viola mandshurica, Rumex crispus in banksides, respectively.

  • PDF

낚시성 인터넷 신문기사 검출을 위한 특징 추출 (Feature Extraction to Detect Hoax Articles)

  • 허성완;손경아
    • 정보과학회 논문지
    • /
    • 제43권11호
    • /
    • pp.1210-1215
    • /
    • 2016
  • 스마트 기기의 발달로 많은 사람들이 인터넷 신문기사를 이용하고 있다. 하지만 인터넷 언론사간의 치열한 경쟁으로 조회수를 올리기 위한 낚시성 기사가 범람하고 있다. 낚시성 신문기사는 제목을 통해 올바른 기사의 줄거리가 제공되지 않았을 뿐만 아니라, 독자로 하여금 잘못된 내용을 떠올리게 한다. 낚시성 신문기사는 핵심에서 벗어난 유명인사 인용, 애매한 문장의 마무리, 제목과 내용의 불일치 등의 특징을 갖는다. 본 논문에서는 이러한 낚시성 기사를 분류하기 위한 특징을 추출하고 성능을 검증해 본다. 기사에 달린 댓글의 키워드를 활용하여 대용량 학습데이터를 생성하고 이를 기반으로 다섯 가지 분류 특징을 추출하였다. 추출된 특징들은 서포트 벡터 머신 분류기를 이용한 실험에서 92%의 정확도를 보여 낚시성 인터넷 신문기사를 분류하는데 적합하다고 판단된다. 뿐만 아니라 제목과 본문의 일관성을 측정하기 위한 전처리 방법으로 고안한 선택적 바이그램 모델은 낚시성 인터넷 신문기사 분류 외에도 일반적인 단문 분석을 위한 전처리 방법으로 유용할 것으로 기대된다.

유사과제파악을 위한 검색 알고리즘의 개발에 관한 연구 (A Study on the Development of Search Algorithm for Identifying the Similar and Redundant Research)

  • 박동진;최기석;이명선;이상태
    • 한국콘텐츠학회논문지
    • /
    • 제9권11호
    • /
    • pp.54-62
    • /
    • 2009
  • 국가적으로 그리고 각 연구기관에서는 투자의 효율성을 기하기 위하여 연구사업 선정과정에서 데이터베이스로부터 중복과제 혹은 유사과제를 검색하는 과정을 거친다. 최근 부얼리언 기반의 키워드 매칭 검색알고리즘의 발전 및 이를 채택한 검색엔진의 개발로 인하여 검색의 정확도가 많이 향상되었지만, 사용자가 입력하는 제한된 수의 키워드들에 의한 검색은 유사과제 파악과 우선순위의 결정에 어려움이 있다. 본 연구에서는 제안된 과제의 문서를 분석하여 다수의 색인어들을 추출하고, 이들에게 가중치를 부여한 후, 기존의 문서들과 비교하여 유사과제를 찾아내는 문서단위의 검색 알고리즘을 제안한다. 구체적으로 벡터공간검색(Vector-Space Retrieval)모델의 한 종류인 TFIDF(Term Frequency Inverse document Frequency)를 기본 구조로 채택한다. 또한 개발되는 알고리즘에는 연구과제 제안문서의 구조에 적합한 속성별 가중치(feature weighting)를 반영하고 검색속도의 향상을 위하여 K-최근접 문서(KNN: K-Nearest Neighbors) 기법도 반영한 알고리즘을 제시한다. 실험을 위하여 실제 연구제안 문서와 구조가 동일한 기존의 보고서를 사용하였는데, KISTI에서 운영하는 과학기술정보포털서비스인 NDSL에서 이미 분류해 놓은 4분야의 1,000 개 연구 보고서 문서를 발췌하여 실험을 하였다.

Gabor, MDLC, Co-Occurrence 특징의 융합에 의한 언어 인식 (Language Identification by Fusion of Gabor, MDLC, and Co-Occurrence Features)

  • 장익훈;김지홍
    • 한국멀티미디어학회논문지
    • /
    • 제17권3호
    • /
    • pp.277-286
    • /
    • 2014
  • 본 논문에서는 Gabor 특징과 MDLC 특징, 그리고 co-occurrence 특징의 융합에 의한 질감 특징 기반언어 인식 방법을 제안한다. 제안된 방법에서는 먼저 시험 영상에 Gabor 변환에 이은 크기 연산자를 적용하여 Gabor 크기 영상을 얻고 그 통계치를 계산하여 결과를 벡터화한다. 이어서 MDLC 연산자를 이용하여 MDLC 영상을 얻고 역시 그 통계치를 계산하여 벡터화한다. 다음으로 시험 영상으로부터 GLCM을 계산하고 이를 이용하여 co-occurrence 특징을 계산한 다음 벡터화한다. 이들 Gabor, MDLC, co-occurrence 특징에 의한 벡터들은 벡터 융합에 의하여 특징 벡터로 사용된다. 분류 단계에서는 얼굴 인식에 주로 사용되는 WPCA를 분류기로 하여 시험 특징 벡터와 가장 유사한 학습 특징 벡터를 찾는다. 제안된 방법의 성능은 15개국 언어의 문서를 스캔하여 얻은 시험 문서 영상 DB에 대한 평균 인식률을 조사하여 알아본다. 실험 결과 제안된 방법은 시험 DB에 대하여 비교적 낮은 특징 벡터 차원으로 매우 우수한 언어 인식 성능을 보여준다.

소셜 네트워크 서비스에 노출된 개인정보의 소유자 식별 방법 (A Method of Identifying Ownership of Personal Information exposed in Social Network Service)

  • 김석현;조진만;진승헌;최대선
    • 정보보호학회논문지
    • /
    • 제23권6호
    • /
    • pp.1103-1110
    • /
    • 2013
  • 본 논문에서는 소셜 네트워크 서비스 상에 공개된 개인정보의 소유자 식별 방법을 제안한다. 구체적으로는 트위터상에 언급된 지역 정보가 게시자의 거주지를 의미하는지를 자동으로 판단하는 방법이다. 개인정보 소유자 식별은 특정인의 개인정보가 온라인 상에 얼마나 노출되어 있는지 파악하여 그 위험도를 산정하기 위한 과정의 일부로서 필수적이다. 제안 방법은 트윗 문장의 어휘 및 구조적 특징 13개를 자질(feature set)로 활용한 소유자 식별 규칙들을 통해 지역정보가 게시자의 거주지를 의미하는지 판단한다. 실제 트위터 데이터를 이용한 실험에서 제안방법이 n-gram을 자질로 사용한 나이브베이지안 같은 전통적인 문서 분류 모델보다 더 높은 성능 (F1값 0.876)을 보였다.

건설 PMIS 현황분석에 기반한 통합양식체계 프로토타입 (Prototype Structure of integrated Document Forms for Construction PMIS based on Analysis)

  • 김명진;정태환;노규태;구교진
    • 한국건설관리학회논문집
    • /
    • 제12권5호
    • /
    • pp.3-11
    • /
    • 2011
  • 타 분야 대비 국내 건설산업의 정보화 노력은 일시적 현상에 그쳐 정보화 역량이 비교적 부족한 현상이 나타나고 있다. 특히 PMIS(Project Management Information System)는 건설관련 업체들 대부분이 구축하여 운용하고 있으나 그 효과나 현장에서의 실효성이 떨어지고 있다. 본 연구는 건설업체 한 곳의 35 개 현장을 대상으로 전반적인 PMIS 활용현황과 특히 공정 및 품질관리 모듈에 대해 현장 실무자 면담을 하여 면밀하게 문제점을 파악하였다. 이를 바탕으로 기본입력양식, 파생양식, 정보항목분석양식으로 이루어진 통합양식체계를 엑셀 프로그램기반으로 개발하였다. 본 연구를 통해 PMIS에서의 현장사용자들에 대한 정보공유 및 의사소통을 개선하여 향후 공사 전체에 대한 공기단축 및 품질향상에 기여할 수 있을 것으로 기대한다.