• Title/Summary/Keyword: 정보접근

검색결과 11,824건 처리시간 0.039초

에머지 접근법을 이용한 국내 벼농사 시스템의 지속가능성 변화 분석 (Analysis of sustainability changes in the Korean rice cropping system using an emergy approach)

  • 김용은;이민영;홍진솔;이윤식;위준;송재준;조기종
    • 환경생물
    • /
    • 제41권4호
    • /
    • pp.482-496
    • /
    • 2023
  • 지난 수십 년간 국내 벼농사 시스템은 규모와 구조 측면에서 많은 변화가 있었으나, 이 시스템의 지속가능성에 대한 연구는 충분히 이뤄지지 않았다. 본 연구에서는 에머지 분석방법을 이용하여, 시스템 생태학의 관점에서 국내 벼농사 시스템의 지속가능성 변화를 분석하고자 했다. 이를 위해서, 2011년, 2016년, 2021년의 국내 벼농사 시스템에 대한 에머지 테이블을 작성하고 에머지 기반 지표 분석을 수행하였다. 에머지 분석 결과, 2011~2021년 동안의 논면적 감소에 따라 벼농사 시스템에 투입된 총 에머지는 10,744E+18 sej year-1에서 8,342E+18 sej year-1로 감소했고, 재생가능한 자원의 비율은 1.4% 감소한 것으로 나타났다. 면적당(ha) 투입된 에머지는 2011년 13.13E+15 sej ha-1 year-1에서 2021년 11.89E+15 sej ha-1 year-1로 감소한 것으로 분석되었고, 질소 비료 사용량 및 노동시간의 감소가 주된 원인이었다. 벼 1 g을 재배하는 데 투입되는 에머지는 2016년과 2021년 사이에 변화가 없었으나(specific emergy: 13.3E+09 sej g-1), 벼농사 시스템의 지속가능성(emergy sustainability index, ESI)은 2011년부터 2021년까지 계속해서 낮아진 것으로 나타났다(2011년: 0.107, 2016년: 0.088, 2021년: 0.086). 본 연구는 국내 벼농사 시스템의 에머지 투입 구조 및 특징에 대한 정량적인 정보를 제공했다. 이 연구 결과는 국내 벼농사 시스템의 생태적 지속가능성 향상을 위한 방안을 구축하는 데 중요한 자료로 활용될 수 있을 것이다.

인공지능 챗GPT의 교육목회에 효율적인 활용방안 (Efficient use of artificial intelligence ChatGPT in educational ministry)

  • 옥장흠
    • 기독교교육논총
    • /
    • 제78권
    • /
    • pp.57-85
    • /
    • 2024
  • 연구의 목적 : 본 연구는 인공지능 생성형 AI를 교육목회에 활용하기 위하여, 인공지능과 생성형 AI의 개념과 교육목회의 교육신학적 측면을 분석하여 인공지능 ChatGPT를 교육목회에 효율적인 활용방안을 모색하는 것이다. 연구의 내용 및 방법 : 본 연구의 내용은 첫째, 인공지능과 생성형 AI의 개념을 인공지능의 개념, 인공지능의 종류, 생성형 언어모델 AI ChatGPT로 나누어 분석하였다. 둘째, 교육목회의 교육신학적 접근을 교육목회의 개념, 교육목회의 목표, 교육목회의 내용, 인공지능 시대 교육목회의 방향으로 나누어 분석하였다. 셋째, 인공지능 ChatGPT를 교육목회의 활용방안을 모색하기 위하여, 초대교회 공동체의 교회의 5가지 기능(행 2:42~47)을 중심으로, 설교 원고 작성의 도구, 예배와 기도의 준비 도구, 교회 교육을 위한 도구, 성도의 교재를 위한 도구, 섬김과 봉사를 위한 도구로 나누어 분석하였다. 결론 및 제언 : 본 연구의 결론은 첫째, 인공지능 ChatGPT를 통해서 설교 원고를 작성하는 경우 설교자의 영성과 신앙, 그리고 통찰을 통해서 질 좋은 설교 원고를 작성할 수 있다. 둘째, 인공지능 ChatGPT를 통해서 효율적으로 예배를 디자인하고, 기획하고, 다양한 시나리오를 통해서, 객관적으로 회중을 섬기는 예배(Service)를 준비할 수 있다. 셋째, 인공지능 ChatGPT를 교회 교육에 활용함으로, 인간과 인공지능 교사와 협업을 통해서 교사와의 상호 보완적인 관계를 유지하면서 활용할 수 있다. 넷째, 인공지능 ChatGPT를 통해서 교회 공동체 구성원들이 영적 교제를 나눌 수 있는 프로그램, 교회 구성원의 필요를 충족시키고 상호 의존성을 강화시킬 수 있는 방안, 새로운 사람들을 적극적으로 환영하고, 다양성을 존중하는 태도를 길러주고, 그리스도의 사랑 안에서 서로 사랑하고, 섬기며, 함께 성장해 나가는 데 중요한 역할을 할 수 있는 유익한 자료들을 제공해 준다. 마지막으로, 인공지능 ChatGPT를 통해서 봉사활동에 대한 다양한 정보와 지역사회의 아동이나 청소년들에게 학습 지원, 멘토링 관련 프로그램, 지역사회의 마을 공동체를 형성하는데 주도적인 역할 등을 수행할 수 있는 방안들을 모색하는 프로그램들을 제공 받을 수 있다.

어린이집 조리종사자 대상의 나트륨 저감화 행동변화단계에 따른 영양지식, 식태도, 식행동, 자아효능감 비교 (Nutrition knowledge, eating attitudes, nutrition behavior, self-efficacy of childcare center foodservice employees by stages of behavioral change in reducing sodium intake)

  • 안윤;김경원;김경민;변진원;여익현;남기선
    • Journal of Nutrition and Health
    • /
    • 제48권5호
    • /
    • pp.429-440
    • /
    • 2015
  • 본 연구는 서울, 경기도, 충청도 지역에 소재하는 어린이집 조리종사자 333명에게 나트륨관련 영양지식, 식태도, 식행동, 자아효능감 등에 대해 설문조사하고, '나트륨 섭취 줄이기' 행동변화단계에 따라 '행동전단계 (고려전/고려/준비)', '행동단계 (행동/유지)' 두 군으로 분류하여 변수간의 차이를 분석하였다. 1) 대상자의 평균 연령은 48.5세이며 대상자의 68.4%는 중년에 해당되었다. 나트륨관련해서 식사관리에 관한 관심도는 대상자의 54.8%가 '매우 관심 있다'고 답하였고, 나트륨관련 식생활정보는 주로 TV/라디오 (56.6%)를 통해서 얻고 있었다. 나트륨관련 영양교육을 1회 경험한 대상자가 가장 많았고 (49.7%), 영양교육의 내용으로는 '나트륨을 줄이는 조리 방법', '나트륨과 혈압의 관계', '나트륨과 질환의 관계' 순이었다. 2) 나트륨관련 영양 지식 총점은 평균 9.3점으로 행동단계군 (9.4점)은 행동전단계군 (9.2점)보다 점수가 조금 높았고 두 군 간의 유의적인 차이는 없었다. 문항별로 '영유아기의 나트륨 섭취의 중요성', '가공식품과 자연식품의 나트륨 함량 비교'에서 대상자들은 매우 높은 정답률을 보였고, '성인의 1일 나트륨 목표섭취량' (27.0%), '영양성분표의 나트륨 함량 산출' (30.3%)에서 정답률이 상당히 저조하였다. 3) 나트륨 저감화에 관한 식태도 총점은 39.6점으로 행동단계군 (40.3점)은 행동전단계군 (36.6점)보다 식태도가 긍정적이었다 (p < 0.001). 행동단계군은 식태도 항목 '음식은 싱겁게 먹어야 함', '짭짤한 맛이 좋음', '식사 시 국이나 찌개를 먹는 것을 좋아함', '식사 시 김치나 장아찌를 먹는 것을 좋아함', '국수, 라면 등 국물류를 좋아함'에서 행동전단계군과 유의적인 차이를 보였고 (p < 0.001), 행동전단계군보다 바람직한 식태도에는 더 동의하고, 바람직하지 않은 식태도에는 덜 동의하였다. 4) 대상자의 식행동 총점은 49.6점으로 행동단계군 (49.9점)은 행동전단계군 (48.5점)보다 식행동이 양호하였으나 유의적인 차이는 없었다. 대부분의 식행동 항목에서 행동단계군은 행동전단계군보다 양호하였는데, 일반 식행동 중 '잡곡밥 먹기', '기름진 음식 먹기' (p < 0.05), 나트륨관련 식행동 중 '간장 등 양념장을 찍어먹는 음식 먹기', '짠 스낵 먹기', '가공식품류 먹기', '외식, 배달음식 먹기' (p < 0.01)에서 유의적인 차이가 있었다. 5) 나트륨 저감화 방법에 관한 자아효능감 총점은 평균 57.1점으로 행동단계군 (58.2점)은 행동전단계군 (52.5점)보다 자아효능감이 높았다 (p < 0.001). 행동단계군은 대부분의 방법에서 행동전단계군보다 자아효능감이 높았는데, 특히 '가공식품 피하기', '소금, MSG 대신 천연조미료 사용하기', '음식의 간은 조리를 마친 후 하기', '국그릇 크기 줄이기', '저염 양념장 만들어 사용하기' 방법에서는 두 군간에 큰 차이를 보였다 (p < 0.001). 6) 식태도는 식행동, 자아효능감과 양의 상관관계 (p < 0.001)를 식행동은 자아효능감과 양의 상관관계 (p < 0.001)를 나타내었고, 영양 지식은 식태도, 식행동, 자아효능감과 양의 상관관계를 보였으나 유의적이지 않았다. 7) 연구 결과 어린이집 조리종사자 대상의 나트륨 저감화 영양사업의 확대가 요구되며 영양교육 등 영양사업 시행 시 나트륨 저감화 행동변화단계별로 대상자를 구분하여 접근할 필요가 있다. 즉, 행동전단계 대상자에게는 나트륨 저감화 실천의 필요성을 인식시키고 태도 변화를 위해 동기 부여 요소를 활용하며 행동단계 대상자에게는 실천이 지속되도록 자기조절 방법, 실천 방법 등을 활용하면 좀 더 효과적일 것이다. 또한 가공식품 산업계에서는 나트륨 저감화 제품 개발이 더욱 활성화됨으로써 급식에 적용 가능한 나트륨 저감화 제품이 확대되어야 할 것으로 사료된다.

인터넷 항공권 예약시스템에서의 '최종가격' 표시시기와 방법 - 2015년 1월 15일 EU사법재판소 C-573/13 판결을 중심으로 - (A Study on the Timing and Method of the Final Price of Air Ticket in Computerised Booking System)

  • 서지민
    • 항공우주정책ㆍ법학회지
    • /
    • 제32권1호
    • /
    • pp.327-353
    • /
    • 2017
  • 소비자가 인터넷을 통해 상품이나 서비스를 구입할 때, 가격은 해당 상품이나 서비스 등에 대한 다양한 정보 중에서 중요한 판단요소로 작용한다. 따라서 판매자가 제공하는 가격표시에 대해서 소비자가 적절한 의사결정 및 선택을 할 수 있도록 다양한 규제가 이루어지고 있다. 특히 항공편의 금액표시와 관련하여 예약단계에서는 수수료나 공항시설사용료, 유류할증료 등을 산입하지 않은 가격이 표시되어 고객이 예약을 완료한 후에야 비로소 이러한 구성요소들이 가산된다는 것을 알게 되는 등의 문제가 계속해서 발생해왔다. 이에 2008년 EU에서는 항공업무규칙이 제정되어 EU 역내에서의 항공편 가격표시에 대해 통일적인 규제가 이루어지게 되었다. 이 규칙은 인터넷 예약사이트 상의 가격표시에도 적용이 된다. 항공운임의 최종가격 표시와 관련한 최초의 사례가 2015년의 Air Berlin v. the Bundesverband 판결이다. 본 판결은 최종가격이 예약시스템의 어느 단계에서 표시되어야 하는가, 또 고객이 선택할 가능성이 있는 모든 항공편에 표시되어야 하는가의 여부와 관련한 사안으로 이 문제에 대하여 EU 사법재판소에서 최초로 판단을 제시한 것이다. 본 판결은 판결은 인터넷 예약 시스템상의 최종지불운임표시시기와 그 방법에 관하여 EU 사법재판소가 구체적인 판단기준을 제시한 최초의 사례라는 점에서 중요한 의의를 갖는다. EC 1008/2008 규칙 제23조의 규정목적은 가격의 투명성과 비교가능성의 보장이라고 할 수 있다. 그러므로 고객에게는 가격이 표시되는 최초의 화면부터 선택후보가 되는 모든 항공편에 대하여 최종가격을 표시되어야 한다. 일견 앞에서 살펴본 독일과 미국의 최근의 논의를 계승하고 있는 것처럼 보이기도 하지만, 소비자인 고객에게 가격을 효과적으로 비교할 가능성을 보장하고, 특히 동업종의 타사와의 비교를 가능하게 한다는 점에서 보면, 이와 같은 해석은 보편적이라고 할 수 있다. 현재 우리나라의 경우 총액운임표시제도를 의무화하고 있으나 최종가격의 표시 시기나 방법과 관련하여 현재 우리에게 문제되고 있는 것은 신용카드를 통한 가격할인을 우선적으로 표시하여 정작 정상운임은 스크롤을 한참 아래로 내려야 겨우 확인이 가능한 문제, 인터넷 배너를 통해 최저가 항공권이라고 광고하고 배너를 클릭해서 들어가 보면 실상은 최저가 운임이 아닌 다른 요금으로 책정이 되게 되는 문제, 최저가 운임에 초점을 두어 소비자의 소비심리를 자극하고, 정작 중요한 취소 수수료에 대한 고지는 소홀히 하는 등의 문제이다. 이러한 점을 해결하기 위해서는 홈페이지 항공권 예약 과정에서도 소비자가 쉽게 확인할 수 있도록 팝업창으로 띄우거나 게시해야 할 필요성이 있다고 생각한다. 인터넷의 발달로 국내 항공사 및 국내 여행 사이트 뿐 만이 아니라 국외 여행 사이트까지 다양하게 소비자가 접근할 수 있는 만큼 국내 소비자를 보호하는 섬세한 규정들이 필요한 시점이다. 현재 가격표시와 관련한 문제는 글로벌 여행예약사이트와 저가항공사의 항공권 예약 건에서 집중된다. 국내예약사이트와 국내일반항공사의 경우 총액운임표시제도와 국내 환불규정에 의해 규제를 받기 때문에 소비자의 피해가 이들에 비해 상대적으로 덜할 수밖에 없다. 반면 글로벌 여행 예약사이트와 저가항공사와 같은 업체들은 이러한 국내 규정들을 무시한 채 허위 과장광고를 통해 소비자를 현혹하고, 결과적으로 국내 소비자의 피해는 급증하고 있는 현실이다. 정부의 법적 제도적 지원과 항공사 및 여행업체의 다각적인 노력 및 아울러 소비자들의 적극적인 참여와 노력이 없으면 항공시장 활성화를 통한 가격경쟁과 서비스개선을 기대하기 어려울 것이다. 소비자들은 항공시장에서 항공운임 및 항공서비스와 관련한 최종적인 심판자 역할을 수행해야 한다. 최종적으로 지불해야 하는 가격을 최초단계에서 고객에게 제시한다는 것은 중요하지만 그 표시방법 등에 대해서도 앞으로 계속적 검토할 필요가 있을 것으로 생각된다. 본 사건이 향후 우리에게 발생할 수 있는 문제들에게 하나의 고려문제가 될 수 있다고 생각된다.

  • PDF

시맨틱 웹 자원의 랭킹을 위한 알고리즘: 클래스중심 접근방법 (A Ranking Algorithm for Semantic Web Resources: A Class-oriented Approach)

  • 노상규;박현정;박진수
    • Asia pacific journal of information systems
    • /
    • 제17권4호
    • /
    • pp.31-59
    • /
    • 2007
  • We frequently use search engines to find relevant information in the Web but still end up with too much information. In order to solve this problem of information overload, ranking algorithms have been applied to various domains. As more information will be available in the future, effectively and efficiently ranking search results will become more critical. In this paper, we propose a ranking algorithm for the Semantic Web resources, specifically RDF resources. Traditionally, the importance of a particular Web page is estimated based on the number of key words found in the page, which is subject to manipulation. In contrast, link analysis methods such as Google's PageRank capitalize on the information which is inherent in the link structure of the Web graph. PageRank considers a certain page highly important if it is referred to by many other pages. The degree of the importance also increases if the importance of the referring pages is high. Kleinberg's algorithm is another link-structure based ranking algorithm for Web pages. Unlike PageRank, Kleinberg's algorithm utilizes two kinds of scores: the authority score and the hub score. If a page has a high authority score, it is an authority on a given topic and many pages refer to it. A page with a high hub score links to many authoritative pages. As mentioned above, the link-structure based ranking method has been playing an essential role in World Wide Web(WWW), and nowadays, many people recognize the effectiveness and efficiency of it. On the other hand, as Resource Description Framework(RDF) data model forms the foundation of the Semantic Web, any information in the Semantic Web can be expressed with RDF graph, making the ranking algorithm for RDF knowledge bases greatly important. The RDF graph consists of nodes and directional links similar to the Web graph. As a result, the link-structure based ranking method seems to be highly applicable to ranking the Semantic Web resources. However, the information space of the Semantic Web is more complex than that of WWW. For instance, WWW can be considered as one huge class, i.e., a collection of Web pages, which has only a recursive property, i.e., a 'refers to' property corresponding to the hyperlinks. However, the Semantic Web encompasses various kinds of classes and properties, and consequently, ranking methods used in WWW should be modified to reflect the complexity of the information space in the Semantic Web. Previous research addressed the ranking problem of query results retrieved from RDF knowledge bases. Mukherjea and Bamba modified Kleinberg's algorithm in order to apply their algorithm to rank the Semantic Web resources. They defined the objectivity score and the subjectivity score of a resource, which correspond to the authority score and the hub score of Kleinberg's, respectively. They concentrated on the diversity of properties and introduced property weights to control the influence of a resource on another resource depending on the characteristic of the property linking the two resources. A node with a high objectivity score becomes the object of many RDF triples, and a node with a high subjectivity score becomes the subject of many RDF triples. They developed several kinds of Semantic Web systems in order to validate their technique and showed some experimental results verifying the applicability of their method to the Semantic Web. Despite their efforts, however, there remained some limitations which they reported in their paper. First, their algorithm is useful only when a Semantic Web system represents most of the knowledge pertaining to a certain domain. In other words, the ratio of links to nodes should be high, or overall resources should be described in detail, to a certain degree for their algorithm to properly work. Second, a Tightly-Knit Community(TKC) effect, the phenomenon that pages which are less important but yet densely connected have higher scores than the ones that are more important but sparsely connected, remains as problematic. Third, a resource may have a high score, not because it is actually important, but simply because it is very common and as a consequence it has many links pointing to it. In this paper, we examine such ranking problems from a novel perspective and propose a new algorithm which can solve the problems under the previous studies. Our proposed method is based on a class-oriented approach. In contrast to the predicate-oriented approach entertained by the previous research, a user, under our approach, determines the weights of a property by comparing its relative significance to the other properties when evaluating the importance of resources in a specific class. This approach stems from the idea that most queries are supposed to find resources belonging to the same class in the Semantic Web, which consists of many heterogeneous classes in RDF Schema. This approach closely reflects the way that people, in the real world, evaluate something, and will turn out to be superior to the predicate-oriented approach for the Semantic Web. Our proposed algorithm can resolve the TKC(Tightly Knit Community) effect, and further can shed lights on other limitations posed by the previous research. In addition, we propose two ways to incorporate data-type properties which have not been employed even in the case when they have some significance on the resource importance. We designed an experiment to show the effectiveness of our proposed algorithm and the validity of ranking results, which was not tried ever in previous research. We also conducted a comprehensive mathematical analysis, which was overlooked in previous research. The mathematical analysis enabled us to simplify the calculation procedure. Finally, we summarize our experimental results and discuss further research issues.

식생태학적(食生態學的) 관점(觀點)에서 본 곰탕류(類) 섭취(攝取)에 관한 예비적연구(豫備的硏究) (A Preliminary Study of Ecological Aspects of Food on a Kind of Gom-Tang(Beef Soup made with Internal Organs and Bone) Intake)

  • 권순자;족립이행;모수미;최경숙;김주혜;고희정
    • 한국식생활문화학회지
    • /
    • 제6권4호
    • /
    • pp.421-432
    • /
    • 1991
  • 1. 본(本) 연구(硏究)의 목적(目的)은 한국인의 식생활(食生活)에서 각별한 위치를 차지하고 있는 곰탕류의 섭취와 그 배경(背景)이 되는 요인의 상호관계(相互關係)를 규명하여, 앞으로 차세대(次世代)에의 영양교육(營養敎育)을 하는 데에 있어서 하나의 단서를 얻기 위함에 있다. 그 첫 단계로 곰탕 전문점을 찾는 손님을 대상으로 식생태학적(食生態學的) 접근방법을 사용하여 조사(調査)하였다. 2. 대상자의 약 67%는 일주일에 $1{\sim}2$회이상(回以上), 15%는 3회이상(回以上) 곰탕류를 섭취하고 있었다. 섭취빈도에 있어서의 연령차(年齡差)는 보이지 않았다. 3. 섭취빈도가 높을수록 맛이나 냄새에 대한 ${\ulcorner}$기호도(嗜好度)${\lrcorner}$가 높고(p<0.001), 칼슘섭취에 유의하고 있었으며(p<0.05), 소양(肝)도 넣어 먹도록 배려(配慮)하고 있었다(p<0.01). 4. 곰탕전문점에 온 이유로서는 전체적으로 봐서 식기호면(食嗜好面)이 가장 높은 비율이었다. 섭취빈도가 높은 쪽에서는 식기호면(食嗜好面)이 강하게 나타난 데에 비해, 섭취빈도가 낮은 쪽에서는 식기호면(食嗜好面)외에 그 음식점의 유명도(有名度)나 친구의 소개 등의 정보면(情報面)이 강하게 나타났다. 5. 다른 한국요리(韓國料理)보다 곰탕류를 선택하는 이유로서는 섭취빈도가 높은 쪽에서는 식기호면(食嗜好面)이나 생리적상태(生理的狀態)에 관한 요인이 가장 강하게 작용하는 데에 비해, 섭취빈도가 낮은 쪽에서는 생리적상태(生理的狀態)에 관한 요인이 가장 강하게 작용하고 있었다. 6. 곰탕류 섭취 후 건강면(健康面)에서의 주관적(主觀的) 심리적평가(心理的評價)에 대해서는(복수회답(複數回答)) 80.5%가 긍정적(肯定的), 30.5%가 특별한 변화가 없고, 6.5%가 부정적(否定的)인 것으로 봐서, 대부분의 사람이 곰탕류는 건강(健康)에 좋다고 인식(認識)하고 있었으며, 그 인식(認識)에는 섭취빈도에 따른 차이(差異)는 보이지 않았다. 7. 연령이 높을수록 곰탕류의 맛이나 냄새에 대한 기호도(嗜好度)가 유의(有意)하게 높았으며, 건강(健康)과의 관련에서는 ${\ulcorner}$식후 소화가 잘 된다${\lrcorner}$라는 이유로 곰탕류를 선택하였으며, 연령이 낮을수록 ${\ulcorner}$식욕(食慾)이 없을 때${\lrcorner}$, ${\ulcorner}$숙취(宿醉)일때${\lrcorner}$에 선택하는 경향이 강한 것으로 봐서, 연령에 따른 섭취빈도의 차(差)는 없으나, 곰탕류를 선택할 때의 기호(嗜好) 의식(意識) 건강(健康)에의 관심 행동면(行動面)에는 약간의 차(差)가 나타났다. 8. 다변량해석(多變量解析)의 결과(結果), 고섭취빈도군(高攝取頻度群)은 주로 50대이상(代以上)이며 곰탕류에 대한 기호도(嗜好度)가 매우 높고 식의식면(食意識面)이나 식행동면(食行動面), 건강면(健康面)에서 긍정적(肯定的)이었다. 이에 반하여 중섭취빈도군(中攝取頻度群)은 주로 40대(代)였으며 곰탕류에 대한 기호도(嗜好度)가 높았으나 고섭취빈도군(高攝取頻度群)에 비해 식의식면(食意識面)이나 식행동면(食行動面)에서 덜 적극적(積極的)인 경향이었다. 저섭취빈도군(低攝取頻度群)은 주로 20대(代)와 30대(代)였으며 곰탕류에 대한 기호도(嗜好度)가 보통이었으며, 식기호면(食嗜好面)보다 ${\ulcorner}$친구의 소개로${\lrcorner}$ 등에 의해서 섭취하고 있었다.

  • PDF

키워드 자동 생성에 대한 새로운 접근법: 역 벡터공간모델을 이용한 키워드 할당 방법 (A New Approach to Automatic Keyword Generation Using Inverse Vector Space Model)

  • 조원진;노상규;윤지영;박진수
    • Asia pacific journal of information systems
    • /
    • 제21권1호
    • /
    • pp.103-122
    • /
    • 2011
  • Recently, numerous documents have been made available electronically. Internet search engines and digital libraries commonly return query results containing hundreds or even thousands of documents. In this situation, it is virtually impossible for users to examine complete documents to determine whether they might be useful for them. For this reason, some on-line documents are accompanied by a list of keywords specified by the authors in an effort to guide the users by facilitating the filtering process. In this way, a set of keywords is often considered a condensed version of the whole document and therefore plays an important role for document retrieval, Web page retrieval, document clustering, summarization, text mining, and so on. Since many academic journals ask the authors to provide a list of five or six keywords on the first page of an article, keywords are most familiar in the context of journal articles. However, many other types of documents could not benefit from the use of keywords, including Web pages, email messages, news reports, magazine articles, and business papers. Although the potential benefit is large, the implementation itself is the obstacle; manually assigning keywords to all documents is a daunting task, or even impractical in that it is extremely tedious and time-consuming requiring a certain level of domain knowledge. Therefore, it is highly desirable to automate the keyword generation process. There are mainly two approaches to achieving this aim: keyword assignment approach and keyword extraction approach. Both approaches use machine learning methods and require, for training purposes, a set of documents with keywords already attached. In the former approach, there is a given set of vocabulary, and the aim is to match them to the texts. In other words, the keywords assignment approach seeks to select the words from a controlled vocabulary that best describes a document. Although this approach is domain dependent and is not easy to transfer and expand, it can generate implicit keywords that do not appear in a document. On the other hand, in the latter approach, the aim is to extract keywords with respect to their relevance in the text without prior vocabulary. In this approach, automatic keyword generation is treated as a classification task, and keywords are commonly extracted based on supervised learning techniques. Thus, keyword extraction algorithms classify candidate keywords in a document into positive or negative examples. Several systems such as Extractor and Kea were developed using keyword extraction approach. Most indicative words in a document are selected as keywords for that document and as a result, keywords extraction is limited to terms that appear in the document. Therefore, keywords extraction cannot generate implicit keywords that are not included in a document. According to the experiment results of Turney, about 64% to 90% of keywords assigned by the authors can be found in the full text of an article. Inversely, it also means that 10% to 36% of the keywords assigned by the authors do not appear in the article, which cannot be generated through keyword extraction algorithms. Our preliminary experiment result also shows that 37% of keywords assigned by the authors are not included in the full text. This is the reason why we have decided to adopt the keyword assignment approach. In this paper, we propose a new approach for automatic keyword assignment namely IVSM(Inverse Vector Space Model). The model is based on a vector space model. which is a conventional information retrieval model that represents documents and queries by vectors in a multidimensional space. IVSM generates an appropriate keyword set for a specific document by measuring the distance between the document and the keyword sets. The keyword assignment process of IVSM is as follows: (1) calculating the vector length of each keyword set based on each keyword weight; (2) preprocessing and parsing a target document that does not have keywords; (3) calculating the vector length of the target document based on the term frequency; (4) measuring the cosine similarity between each keyword set and the target document; and (5) generating keywords that have high similarity scores. Two keyword generation systems were implemented applying IVSM: IVSM system for Web-based community service and stand-alone IVSM system. Firstly, the IVSM system is implemented in a community service for sharing knowledge and opinions on current trends such as fashion, movies, social problems, and health information. The stand-alone IVSM system is dedicated to generating keywords for academic papers, and, indeed, it has been tested through a number of academic papers including those published by the Korean Association of Shipping and Logistics, the Korea Research Academy of Distribution Information, the Korea Logistics Society, the Korea Logistics Research Association, and the Korea Port Economic Association. We measured the performance of IVSM by the number of matches between the IVSM-generated keywords and the author-assigned keywords. According to our experiment, the precisions of IVSM applied to Web-based community service and academic journals were 0.75 and 0.71, respectively. The performance of both systems is much better than that of baseline systems that generate keywords based on simple probability. Also, IVSM shows comparable performance to Extractor that is a representative system of keyword extraction approach developed by Turney. As electronic documents increase, we expect that IVSM proposed in this paper can be applied to many electronic documents in Web-based community and digital library.

진주 가공부산물(육 및 패주)의 이화학적 특성 (Physicochemical Properties of Pearl Oyster Muscle and Adductor Muscle as Pearl Processing Byproducts)

  • 김진수;김혜숙;오현석;강경태;한강욱;김인수;정보영;문수경;허민수
    • 한국식품영양과학회지
    • /
    • 제35권4호
    • /
    • pp.464-469
    • /
    • 2006
  • 진주 채취 후 폐기되는 진주조개 육 및 패주를 기능성 식품의 추출소재 또는 가공품의 소재와 같이 효율적으로 이용하기 위한 기초 연구로서 진주조개 육 및 패주의 식품성분특성에 대하여 살펴보았다 진주조개 육의 중금속은 수은과 크롬의 경우 검출되지 않았고, 카드뮴의 경우 0.06 ppm, 납의 경우 0.11 prm이 검출되었다. 또한 패주의 경우 검토한 4종의 중금속이 모두 검출되지 않았다. 휘발성염기질소 함량과 pH는 진주조개 육의 경우 각각 11.6 mg/100 g 및 6.31이었고, 패주의 경우 각각 8.6 mg/100 g 및 6.33을 나타내었다. 이와 같은 결과로 미루어 보아 진주조개 패주 및 육은 식품가공 소재로서 식품위생적인 면에서 문제가 없었다. 패주의 조단백질 및 총 아미노산 함량은 각각 16.5%와 15.691 mg/100 g으로서, 진주조개 육(11.2% and 10,131 mg/100 g)과 대조구인 굴(12.1% and 11,213 mg/100 g)보다 높았으며, 칼슘과 인의 함량은 육이 각각 93.4mg/100g과 116.0mg/100g, 패주가 75.2 mg/100 g과 148.1 mg/100 g이었다. 유리아미노산과 taste value는 진주조개 육이 각각 635.5 mg/100 g과 40.2, 패주가 각각 734.9 mg/100 g과 24.1이었으나, 굴의 경우 각각 883.8 mg/100 g과 40.2로 진주 가공부산물보다 높은 수치를 나타내었다. 이상의 이화학적, 영양적 특성으로 살펴본 결과, 진주조개 패주는 육에 비하여 단백질 및 탄수화물, 총 아미노산 함량 및 무기질 함량이 높아 근육에 비하여 영양적인 면에서 식품 재자원으로서 우수하다고 판단되었다. 하지만 진주조개 패주 및 육은 굴이나 기타 패류에 비하여 맛 특성은 낮아 맛 추출 소재로는 부적절하다고 판단되었다.련이 필요한 것으로 사료된다. 세부속성별로는 "분위기가 조용하고 편안하다.", "불만이나 고충이 신속히 처리된다."라는 속성이 중점개선 영역에 포함되어 분위기와 고충처리 부분에 대한 개선을 위한 집중적인 노력이 필요한 것으로 분석되었고, "내부시설 및 기물이 쾌적하다.", "종업원이 친절하다." 항목은 유지관리 영역에 포함되기는 하였으나, 수행도 수준이 중요도에는 다소 못 미쳐 일부 개선이 필요한 것으로 사료된다. 전반적으로 기존의 일반 베이커리 연구들에서 나타난 선택속성 및 고객인지 중요도가 제품중심이었던 결과와는 달리 베이커리카페에 대해 고객이 인지하는 중요 선택속성은 제품, 서비스, 인테리어 등의 복합적인 요소가 포함되는 것으로 나타나 향후 베이커리카페 관련연구에서는 이러한 차이를 명확히 파악하고 연구를 전개해 나가야 할 것으로 사료된다. 또한 업체의 마케팅전략 수립에 있어서도 고씩의 욕구에 부응하기 위해 중요도와 수행도의 차이가 큰 선택속성 차원과 세부항목을 중점대상으로 하여 일반 베이커리와는 구분되는 방식으로 접근해야 할 것으로 판단된다. 이상의 결과를 종합해볼 때, 베이커리카페 이용고객은 특징적인 선택속성을 기준으로 베이커리카페를 선택하는 것으로 나타나 새로운 외식 산업 군인 베이커리카페의 조기정착과 발전을 위해서는 이러한 선택속성에 대한 이해를 바탕으로 활발한 연구가 진행되어야 할 것으로 사료된다. 또한 본 연구를 통해 도출된 선택속성 차원 중 많은 경우에 있어 고객이 인지하고 있는 중요도에 비해 수행도가 낮은 것으로 나타나 해당 차원의 개선을 위한 경영자들의 노력이 요구되어 진다. 체중군(0.82)에 비해 영양 질적 지수(INQ)가 높았으며(p<0.0335), 비타민 $B_1$은 정상 체중군이 유의적으로 가장 높은 영양 질적 지수를 보여주었다(p<0.0452). 이상의 결과로

폭소노미 사이트를 위한 랭킹 프레임워크 설계: 시맨틱 그래프기반 접근 (A Folksonomy Ranking Framework: A Semantic Graph-based Approach)

  • 박현정;노상규
    • Asia pacific journal of information systems
    • /
    • 제21권2호
    • /
    • pp.89-116
    • /
    • 2011
  • In collaborative tagging systems such as Delicious.com and Flickr.com, users assign keywords or tags to their uploaded resources, such as bookmarks and pictures, for their future use or sharing purposes. The collection of resources and tags generated by a user is called a personomy, and the collection of all personomies constitutes the folksonomy. The most significant need of the folksonomy users Is to efficiently find useful resources or experts on specific topics. An excellent ranking algorithm would assign higher ranking to more useful resources or experts. What resources are considered useful In a folksonomic system? Does a standard superior to frequency or freshness exist? The resource recommended by more users with mere expertise should be worthy of attention. This ranking paradigm can be implemented through a graph-based ranking algorithm. Two well-known representatives of such a paradigm are Page Rank by Google and HITS(Hypertext Induced Topic Selection) by Kleinberg. Both Page Rank and HITS assign a higher evaluation score to pages linked to more higher-scored pages. HITS differs from PageRank in that it utilizes two kinds of scores: authority and hub scores. The ranking objects of these pages are limited to Web pages, whereas the ranking objects of a folksonomic system are somewhat heterogeneous(i.e., users, resources, and tags). Therefore, uniform application of the voting notion of PageRank and HITS based on the links to a folksonomy would be unreasonable, In a folksonomic system, each link corresponding to a property can have an opposite direction, depending on whether the property is an active or a passive voice. The current research stems from the Idea that a graph-based ranking algorithm could be applied to the folksonomic system using the concept of mutual Interactions between entitles, rather than the voting notion of PageRank or HITS. The concept of mutual interactions, proposed for ranking the Semantic Web resources, enables the calculation of importance scores of various resources unaffected by link directions. The weights of a property representing the mutual interaction between classes are assigned depending on the relative significance of the property to the resource importance of each class. This class-oriented approach is based on the fact that, in the Semantic Web, there are many heterogeneous classes; thus, applying a different appraisal standard for each class is more reasonable. This is similar to the evaluation method of humans, where different items are assigned specific weights, which are then summed up to determine the weighted average. We can check for missing properties more easily with this approach than with other predicate-oriented approaches. A user of a tagging system usually assigns more than one tags to the same resource, and there can be more than one tags with the same subjectivity and objectivity. In the case that many users assign similar tags to the same resource, grading the users differently depending on the assignment order becomes necessary. This idea comes from the studies in psychology wherein expertise involves the ability to select the most relevant information for achieving a goal. An expert should be someone who not only has a large collection of documents annotated with a particular tag, but also tends to add documents of high quality to his/her collections. Such documents are identified by the number, as well as the expertise, of users who have the same documents in their collections. In other words, there is a relationship of mutual reinforcement between the expertise of a user and the quality of a document. In addition, there is a need to rank entities related more closely to a certain entity. Considering the property of social media that ensures the popularity of a topic is temporary, recent data should have more weight than old data. We propose a comprehensive folksonomy ranking framework in which all these considerations are dealt with and that can be easily customized to each folksonomy site for ranking purposes. To examine the validity of our ranking algorithm and show the mechanism of adjusting property, time, and expertise weights, we first use a dataset designed for analyzing the effect of each ranking factor independently. We then show the ranking results of a real folksonomy site, with the ranking factors combined. Because the ground truth of a given dataset is not known when it comes to ranking, we inject simulated data whose ranking results can be predicted into the real dataset and compare the ranking results of our algorithm with that of a previous HITS-based algorithm. Our semantic ranking algorithm based on the concept of mutual interaction seems to be preferable to the HITS-based algorithm as a flexible folksonomy ranking framework. Some concrete points of difference are as follows. First, with the time concept applied to the property weights, our algorithm shows superior performance in lowering the scores of older data and raising the scores of newer data. Second, applying the time concept to the expertise weights, as well as to the property weights, our algorithm controls the conflicting influence of expertise weights and enhances overall consistency of time-valued ranking. The expertise weights of the previous study can act as an obstacle to the time-valued ranking because the number of followers increases as time goes on. Third, many new properties and classes can be included in our framework. The previous HITS-based algorithm, based on the voting notion, loses ground in the situation where the domain consists of more than two classes, or where other important properties, such as "sent through twitter" or "registered as a friend," are added to the domain. Forth, there is a big difference in the calculation time and memory use between the two kinds of algorithms. While the matrix multiplication of two matrices, has to be executed twice for the previous HITS-based algorithm, this is unnecessary with our algorithm. In our ranking framework, various folksonomy ranking policies can be expressed with the ranking factors combined and our approach can work, even if the folksonomy site is not implemented with Semantic Web languages. Above all, the time weight proposed in this paper will be applicable to various domains, including social media, where time value is considered important.

혁명시기 중국공산당의 문서당안관리 (Chinese Communist Party's Management of Records & Archives during the Chinese Revolution Period)

  • 이원규
    • 기록학연구
    • /
    • 제22호
    • /
    • pp.157-199
    • /
    • 2009
  • 중국공산당의 창당과 함께 문서와 당안 관리 조직이 출현한 것은 아니었다. 1926년 중앙 비서처가 설립된 이후 문서과와 그 소속 문건열람처, 문건보관처 등이 설립됨으로써 본격화되었던 것이다. 1930년대 초 비서조직의 업무개선이 집중적으로 논의되었는데, 비판의 핵심은 정치적 역할을 자각하지 못한 채 단순히 "기능적 조직"으로 전락하고 말았다는 것이었고, 이의 해결 방안은 곧 "비서처 업무의 정치화"였다. 나아가 1940년대에는 "정풍운동"의 영향으로 문서만이 아니라 각종 주요 정보자료를 수집하여 정리, 제공하는 재료과의 임무가 강조되었다. 한편, 문서의 작성에 있어서 인물이나 기관의 명칭을 다르게 표기한다든가 약물을 사용하여 문서를 작성하는 등 보안의 유지가 줄곧 강조되었으며, 또한 업무활동과 지역의 상황에 대한 정기보고를 통해 중앙과 지방간의 소통이 강조되었다. 비서장은 중요 공문의 초안을 작성하는 것은 물론, 모든 문건의 열람과 심사를 담당하여 문서처리의 중심적 역할을 수행하였다. 문서의 처리가 끝나면 당안이라고 불리우며 보관되었는데, 중앙 비서처 문서과의 "문건보관처"가 이러한 역할을 담당하였다. "중앙문고"라고 불리기도 한 문건보관처는 1930년대 초부터 더 이상 당안을 이관받을 수 없었지만, 1940년대에는 재료과가 문서와 간행재료를 보존하고 제공하는 역할을 강화해갔다. 특히 조사연구를 위한 재료의 수집이 실행되었고, 일본의 통치 아래에 있던 지역을 회복하면서 대량의 당안과 문헌 자료를 수집하기도 하였다. 1931년 당안의 분류방법과 목록작성방법이 규정된 이후 특히 1940년대에 본격적으로 제도화되었는데, 기본적으로는 주제분류법이 유지되었고 기초적인 목록표기법이 채택되었다. "중요성"과 "기밀성"을 관리의 기준으로 삼는 원칙은 비교적 초기부터 나타났지만, 문서의 보존과 폐기를 구분하는 평가의 개념이나 절차는 명확치 않았다. 비밀의 보안관리와 접근제한의 제도를 실행하는 한편, "보존과 이용의 통일"이라는 구호에서도 알 수 있듯이 당안재료의 이용제공에 대한 문제의식은 매우 강렬하였다. 혁명운동과 전쟁의 와중에서도 중국공산당은 문서당안의 관리와 보존을 강화해가는 노력을 지속했다. 그 성과가 항상 바람직한 것도 아니었고, 그 경험을 안정적으로 발전시켜갈 수 있었던 것도 아니었다. 그것은 필경 중국공산당이 처해 있던 역사적 여건에서는 불가피한 일이었을 것이다. 이 과정에서 두드러지게 나타난 특성은 단지 기능적인 수준에서 문서당안관리의 효율화를 추진했던 것이 아니라 것이 아니라, 오히려 중국공산당의 혁명운동에 미치는 정치적 의의에 대한 자각을 강화해가며, 혁명 정책 연구의 실증적 근거이자 또한 중국공산당 역사의 증거로서 당안재료가 갖는 가치에 주목하였던 것에서 찾을 수 있을 것이다.