• 제목/요약/키워드: Association Mining

검색결과 1,053건 처리시간 0.03초

Insights into the genetic diversity of indigenous goats and their conservation priorities

  • Liu, Gang;Zhao, Qianjun;Lu, Jian;Sun, Feizhou;Han, Xu;Zhao, Junjin;Feng, Haiyong;Wang, Kejun;Liu, Chousheng
    • Asian-Australasian Journal of Animal Sciences
    • /
    • 제32권10호
    • /
    • pp.1501-1510
    • /
    • 2019
  • Objective: An experiment was conducted to evaluate genetic diversity of 26 Chinese indigenous goats by 30 microsatellite markers, and then to define conservation priorities to set up the protection programs according to the weight given to within- and between-breed genetic diversity. Methods: Twenty-six representative populations of Chinese indigenous goats, 1,351 total, were sampled from different geographic regions of China. Within-breed genetic diversity and marker polymorphism were estimated calculating the mean number of alleles, observed heterozygosities, expected heterozygosities, fixation index, effective number of alleles and allelic richness. Conservation priorities were analyzed by statistical methods. Results: A relatively high level of genetic diversity was found in twenty-four population; the exceptions were in the Daiyun and Fuqing goat populations. Within-breed kinship coefficient matrices identified seven highly inbred breeds which should be of concern. Of these, six breeds receive a negative contribution to heterozygosity when the method was based on proportional contribution to heterozygosity. Based on Weitzman or Piyasatian and Kinghorn methods, the breeds distant from others i.e. Inner Mongolia Cashmere goat, Chengdu Brown goat and Leizhou goat obtain a high ranking. Evidence from Caballero and Toro and Fabuel et al method prioritized Jining Gray goat, Liaoning Cashmere goat, and Inner Mongolia Cashmere goat, which agree with results from Kinship-based methods. Conclusion: Conservation priorities were determined according to multiple methods. Our results suggest Inner Mongolia Cashmere goat (most methods), Jining Gray goat and Liaoning Cashmere goat (high contribution to heterozygosity and total diversity) should be prioritized based on most methods. Furthermore, Daiyun goat and Shannan White goat also should be prioritized based on consideration of effective population size. However, if one breed can continually survive under changing conditions, the straightforward approach would be to increase its utilization and attraction for production via mining breed germplasm characteristics.

인공지능 알고리즘은 사람을 차별하는가? (Does Artificial Intelligence Algorithm Discriminate Certain Groups of Humans?)

  • 오요한;홍성욱
    • 과학기술학연구
    • /
    • 제18권3호
    • /
    • pp.153-216
    • /
    • 2018
  • 빅데이터에 근거하여 자동적인 의사결정을 내리는 알고리즘이 사회의 각종 영역에서 점차 널리 사용되고 있는 저변에는 알고리즘의 의사결정이 사회의 자원을 보다 효율적으로 분배하리라는 기대 뿐만 아니라 그 결정이 선입견, 편향, 자의적 판단 등이 개입될 수 있는 인간의 의사결정보다 더 공정한 결과를 낳으리라는 희망 또한 자리잡고 있다. 하지만 알고리즘 의사결정이 그 결정에 의해 영향 받는 이들을 공정하게 다루지 않는다는 주장이 여러 사례와 함께 거듭 제기되면서, 의사결정이 어떻게 절차화되었는지, 또한 특정한 의사결정을 공정하다고 판단하는 데에 어떤 요인이 고려되는지에 대한 근본적인 질문들이 새롭게 제기되고 있다. 본 논문은 사법, 치안, 국가 안보의 세 가지 알고리즘 활용 영역에서 차별의 문제가 제기되는 상황을 구체적으로 분석한 연구들을 검토함으로써, 인공지능 알고리즘이 과연 특정 집단의 인간을 차별하는지, 그리고 공정한 의사결정을 분별하는 기준은 무엇인지 살펴보고자 한다. 본격적인 검토에 앞서 데이터 마이닝 각 단계에서 의도적으로 그리고 비의도적으로 편향적인 결과가 산출될 수 있는 원인에는 무엇이 있는지를 살필 것이다. 결론에서는 이러한 이론적이고 실질적인 검토가 현대 한국 사회에 시사하는 바가 무엇인지 간추려 제시할 것이다.

국가핵심기술 관계망 구축을 통한 연관정보 분석연구: 디스플레이 기술을 중심으로 (A Study on the Analysis of Related Information through the Establishment of the National Core Technology Network: Focused on Display Technology)

  • 박세희;윤원석;장항배
    • 한국전자거래학회지
    • /
    • 제26권2호
    • /
    • pp.123-141
    • /
    • 2021
  • 경제 구조의 기술 의존성이 강해져 국가핵심기술의 중요성은 더욱 대두되고 있다. 하지만 기술 자체적 특성으로 인해 연관 범위가 추상적이고 국가핵심기술 고유의 특성상 정보공개가 제한적이기 때문에 보호대상이 될 기술의 범위를 정하는 것에 어려움이 있다. 이를 해결하기 위해 국가핵심기술과 연관성이 높은 중요 기술을 판별하는 데에 최적화 된 문헌 종류와 분석 기법을 제안하였다. 디스플레이 분야 국가핵심기술 키워드로 수집한 네 개 문헌종류(뉴스, 논문, 보고서, 특허) 데이터에 빅데이터 분석의 텍스트 마이닝 분석기법인 TF-IDF와 LDA 토픽 모델링을 적용하는 파일럿 테스트를 진행하였다. 그 결과로 특허 데이터에 LDA 토픽 모델링을 적용한 결과가 국가핵심기술과 연관성이 높은 중요기술을 추출하였다. OLED, 마이크로LED를 포함하여 디스플레이 전후방산업에 관련된 중요 기술을 판별 할 수 있었으며 이 결과를 관계망으로 시각화하여 국가핵심기술과 연관된 중요 기술의 범위를 명확히 하였다. 본 연구를 통해 기술이 가지는 연관범위의 모호성을 보다 명확히 하였으며, 국가핵심기술이 가지는 제한적인 정보공개 특성을 극복할 수 있다.

미국 정보 대학의 데이터사이언스 학위 현황 연구 (Degree Programs in Data Science at the School of Information in the States)

  • 박형주
    • 한국도서관정보학회지
    • /
    • 제53권2호
    • /
    • pp.305-332
    • /
    • 2022
  • 본 연구의 목적은 문헌정보학 프로그램이 있는 정보 대학에서 수여하는 데이터사이언스 학위의 현황을 알아보는 것이다. 데이터 수집의 대상은, 2022년 미국도서관협회의 인가를 받은 문헌정보학 프로그램이 있는 64개의 대학에서 수여하는 데이터사이언스 학위였다. 분석의 대상은 각 대학의 데이터사이언스 학위 과정, 부전공, 세부 전공, 수료증, 취업 후 예상 진로, 취업률 등이었다. 교과 분석을 위해 미국 정보 대학에서 제시한 교과목 명, 교과 설명, 중점 교육 분야를 분석했다. 데이터사이언스를 학위 명으로 개설한 대학은 총 8개 정보 대학의 12개 학위였으며, 학사 학위 5개, 석사 학위 6개, 박사 학위 1개였다. 개설된 교과의 주제는 데이터사이언스 입문, 정보검색, 데이터마이닝, 데이터베이스, 데이터와 인문학, 머신 러닝, 메타데이터, 연구 방법론, 데이터 분석 및 시각화, 실습/캡스톤, 윤리 및 보안, 이용자, 정책, 큐레이션 및 관리였다. 대부분의 대학은 전통적인 문헌정보학 교과를 개설하지 않고 있었다. 정보 대학이 제시한 졸업 후 예상 취업 진로는 데이터사이언티스트, 데이터 엔지니어, 데이터 분석가 등이었다. 본 연구의 결과는 정보학의 관점에서 데이터사이언스 학위 과정, 세부 전공, 수료증 또는 교과과정 개발 및 개정을 위한 논의에 활용될 수 있는 기초 자료로 활용되기를 기대한다.

비대칭 V-cut의 갱내 광산에 대한 적용성 연구 (Study on Applicability of Asymmetry V-Cut method in Underground Mine)

  • 김정규;정승원;김준하;김종관
    • 터널과지하공간
    • /
    • 제31권6호
    • /
    • pp.520-533
    • /
    • 2021
  • 갱내채광개발의 안정성 문제로 굴착단면을 축소하였을 때 발생한 경제적 손실을 최소화하기 위해 발파효율을 증가시킬 필요가 있으며, 이를 위해 새로운 발파 설계를 제안하였다. 본 연구에서는 현장의 생산발파, 생산발파에 확대공을 2열 추가한 1차 제안발파 그리고 확대공에 1열만 추가하여 비대칭을 이루는 2차 제안발파의 발파효율을 비교하였다. 발파효율 평가지표로는 굴진율과 파쇄입도로 선정하였다. 굴진율의 경우 일반대비 1차 제안발파는 6.07%, 2차 제안발파는 4.65% 향상하였고, 파쇄입도의 경우 P80 기준으로 일반발파 대비 1차 제안발파는 약 58%, 2차 제안발파는 약 47% 파쇄입도가 감소하였다. 평가지표에 따라 1차 제안발파가 2차 제안발파보다 좋은 발파효율을 보이지만, 평가지표의 결과의 차이가 미비하여 1차 제안발파에 추가적으로 소요된 작업시간과 비용을 고려하였을 때 2차 제안발파인 비대칭 V-cut이 현장에 더 적합한 발파설계라 판단된다.

카지노 유치지역 주민의 도박참여 및 도박중독 실태와 삶의 만족도: 강원도 폐광지역을 중심으로 (Gambling Behavior, Gambling-related Problem, and The Satisfaction with Life among the Residents Who Live in the Location of Casinos)

  • 이인혜
    • 한국심리학회지 : 문화 및 사회문제
    • /
    • 제11권4호
    • /
    • pp.67-82
    • /
    • 2005
  • 본 연구에서는 카지노를 유치한 강원 남부 폐광지역 주민들의 도박참여 및 도박중독의 실태를 살펴보고, 도박참여와 도박중독의 정도에 따라 주민이 지각하는 삶의 만족도에서 차이가 있는지, 그리고 폐광지역 내에서도 지역 간 차이가 있는지를 확인해 보고자 하였다. 이를 위해 본 연구에서는 카지노 시설과의 근접성에 따라 지역을 세 곳으로 구분하였다, 고한·사북읍, 태백시, 그리고 기타 정선군 지역. 이 세 지역에 거주하는 주민 559명에게 도박실태 척도, K-NODS, 카지노의 영향력에 대한 지각 척도, 그리고 삶의 만족도 척도를 실시하였다. 연구결과, 도박중독과 삶의 만족도 간에는 유의미한 부적 상관을 보였다. 거주지에 따라 카지노의 영향력에 대한 지각, 도박중독 그리고 삶의 만족도에서 차이가 있었다. 카지노의 영향력에 대해서는 태백이 고한·사북보다 그리고 태백이 정선의 기타지역보다 더 긍정적으로 지각하였고, 삶의 만족도에서는 기타지역이 고한·사북지역과 태백지역보다 더 긍정적으로 나타났다. 반대로 도박중독은 고한·사북이 태백지역보다 높았다. 거주지에 따른 도박중독자 수에서도 차이가 있었다. 문제성 및 병적 도박자군에 속하는 사람의 비율은 고한·사북이 태백과 기타지역보다 2배 이상 높은 것으로 나타났고, 병적 도박 집단이 다른 집단들보다 여러 가지 도박행위에 관여하는 정도가 컸다. 이 같은 결과에 대해 낙후된 지역 경제에 도움을 주기 위해 폐광지역에 카지노장이 설립되었지만 그 지역민에게 폐해로 작용될 수 있음을 논의하였다.

마켓 인사이트를 위한 상품 리뷰의 다차원 분석 방안 (Multi-Dimensional Analysis Method of Product Reviews for Market Insight)

  • 박정현;이서호;임규진;여운영;김종우
    • 지능정보연구
    • /
    • 제26권2호
    • /
    • pp.57-78
    • /
    • 2020
  • 인터넷의 발달로, 소비자들은 이커머스에서 손쉽게 상품 정보를 확인한다. 이때 활용되는 상품 리뷰는 사용자 경험을 토대로 작성되어 구매의사결정의 효율성을 높일 뿐만 아니라 상품 개발에 도움을 주기도 한다. 하지만, 방대한 양의 상품 리뷰에서 관심있는 평가차원의 세부내용을 파악하는 데에는 많은 시간과 노력이 소비된다. 예를 들어, 노트북을 구매하려는 소비자들은 성능, 무게, 디자인과 같은 평가차원에 대해 각 차원별로 비교 상품의 평가를 확인하고자 한다. 따라서 본 논문에서는 상품 리뷰에서 다차원 상품평가 점수를 자동적으로 생성하는 방안을 제안하고자 한다. 본 연구에서 제시하는 방안은 크게 2단계로 구성된다. 사전준비 단계와 개별상품평가 단계로, 대분류 상품군 리뷰를 토대로 사전에 생성된 차원분류모델과 감성분석모델이 개별상품의 리뷰를 분석하게 된다. 차원분류모델은 워드임베딩과 연관분석을 결합함으로써 기존 연구에서 차원과 단어들의 관련성을 찾기 위한 워드임베딩 방식이 문장 내 단어의 위치만을 본다는 한계를 보완한다. 감성분석모델은 정확한 극성 판단을 위해 구(phrase) 단위로 긍부정이 태깅된 학습데이터를 구성하여 CNN 모델을 생성한다. 이를 통해, 개별상품평가 단계에서는 구 단위의 리뷰에 준비된 모델들을 적용하고 평가차원별로 종합함으로써 다차원 평가점수를 얻을 수 있다. 본 논문의 실험에서는 대분류 상품군 리뷰 약 260,000건으로 평가모델을 구성하고, S사와 L사의 노트북 리뷰 각 1,011건과 1,062건을 실험데이터로 활용한다. 차원분류모델은 구로 분해한 개별상품 리뷰를 6개 평가차원으로 분류했고, 기존 워드임베딩 방식보다 연관분석을 결합한 모델의 정확도가 13.7% 증가했음을 볼 수 있었다. 감성분석모델은 문장보다 구 단위로 학습한 모델이 평가차원을 면밀히 분석함으로써 29.4% 더 높은 정확도를 보임을 확인했다. 본 연구를 통해 판매자, 소비자 모두가 상품의 다차원적 비교가 가능하다는 점에서 구매 및 상품 개발에 효율적인 의사결정을 기대할 수 있다.

한.일 고등학교 세계지리 교과서 내용 비교 분석 -국제이해교육의 관련 내용을 중심으로- (Comparative Analysis of Korean and Japanese Textbooks on World Geography: Focused on the Contents of Global Education)

  • 양원택
    • 한국지역지리학회지
    • /
    • 제2권2호
    • /
    • pp.75-92
    • /
    • 1996
  • 본 연구는 국제이해교육에 대한 이론적 바탕을 제공하고, 또 현재 한 일 고등학교에서 쓰이고 있는 세계지리 교과서의 국제이해 관련 내용을 2개의 중심주제, 6개의 소주제, 20개의 중심개념의 교과서 분석틀로 나누어 비중도 분석을 실시하여, 학생들이 사용하고 있는 세계지리 교과서가 국제 이해교육을 위해 효율적으로 구성되어 있고 그 내용이 적절한지 개괄적으로 살펴봄으로서 앞으로 한 일 고등학교 세계지리 교과서의 구성 및 내용체계가 어떠한 방향으로 나아가야 할 것인가를 제시하고자 한 연구이다. 한국의 6차 교육과정에 의한 세계지리 교과서와 일본의 6차 개정에 의한 세계지리 교과서를 비교 분석한 결과에 의하면, 중심주제인 상호의존의 영역에서는 양국이 거의 비슷한 비중을 보였으며, 상존(常存)문제의 영역인 인권, 인구, 자원문제에 있어서는 상당한 비중 차이를 보였는데 이는 한국과 일본의 교육과점의 차이로 볼 수 있다. 즉 한국의 경우 단원별로 계통지리적 방법과 지지적(地誌的) 방법을 별도로 채택만 반면 일본의 경우는 계통지리적 방법과 지지적(地誌的) 방법과의 상호보완 관계로 채택함으로서 취급된 지역에 대해서는 다면적으로 고찰시키도록 하고 있다. 따라서 한국 세계지리 교과서는 다양한 지역을 이해시키기 위한 구성 및 내용체계를 보이는 반면 일본 세계지리 교과서는 소수의 지역이지만 계통적 주제별로 자세하게 그 지역을 이해시키기 위한 구성 및 내용체계를 보이고 있음을 알 수 있다. 결론적으로, 국제이해교육을 위한 향후 양국의 지리 교과서는 본 연구자가 제시한 바 있는 국제이해교육의 기본적 틀에 맞추어 구성해 가는 것과 내용면에 있어서도 한국의 경우는 단편 지식위주의 서술에서 탈피해야 할 것이며, 일본의 경우는 6차 개정에서 많은 진전을 엿볼 수 있지만 자국위주 및 자국우월주의적 서술로부터의 탈피가 필요하다고 생각한다.

  • PDF

과학에 관련된 위험 인식과 대응의 역사와 특징 -혈압을 중심으로- (History and Characteristics of Risk Perception and Response Related to Science: Focused on Blood Pressure)

  • 장원빈;김민철
    • 한국과학교육학회지
    • /
    • 제43권6호
    • /
    • pp.549-562
    • /
    • 2023
  • 최근 사회는 과학기술의 발달과 함께 인간이 생산하는 다양한 위험이 확산되는 VUCA 시대에 접어들었다. 시민들의 위험 소양 수준을 높여 이러한 위험에 대응할 수 있는 일상적인 대비를 강화할 필요가 있다. 이를 위해서 위험을 과학적이고 객관적으로 판단하고 대응할 수 있도록 과학 교육의 역할에 대한 재고가 필요하다. 이에 위험 사회에서 과학 교육의 역할을 규명하기 위해 본 연구는 과학과 관련된 위험 인식과 위험 대응의 역사를 검토하고 그 특징을 분석하였다. 이 과정에서 혈압으로 인해 발생하는 위험에 대한 인식과 대응을 세 가지 맥락(역사적 맥락, 교육과정 맥락, 교과서 맥락)에서 분석하였다. 역사적 맥락은 심혈관계 지식의 역사와 관련된 연구가 이루어진 학술지 중 SCIE에 등재된 학술지를 연구대상으로 선정하였다. 선정된 학술지에서 'Hypertenstion', 'History'라는 키워드로 논문을 선정하였고, 이를 시대별로 비교 분석하였다. 교육과정 맥락은 제1차 교육과정부터 2022 개정 교육과정까지 분석하였고, 혈압과 관련한 내용요소, 그리고 성취기준을 비교 분석하였다. 제1차부터 제6차 교육과정까지는 혈압으로 인해 발생하는 위험이 제시되지 않았고, 제7차 교육과정부터 혈압으로 인해 발생하는 위험이 포함된 것으로 확인되었다. 교과서 맥락은 제7차 교육과정 생물Ⅰ, 2015 개정 교육과정 생명과학Ⅰ 과 보건을 선정하여 텍스트 추출을 통해 교과목을 대표하는 키워드를 선정하였다. 이 키워드를 바탕으로 위험 인식과 위험 대응을 어떻게 제시하고 있는지 분석하였다. 그리고 교과서에서 제시된 자료들을 분석하여 위험 인식과 위험 대응의 특징을 도출하였다. 본 연구는 과학 교육에서 위험 인식과 위험 대응의 역할을 확인하였다는 점에서 의미를 갖는다.

키워드 자동 생성에 대한 새로운 접근법: 역 벡터공간모델을 이용한 키워드 할당 방법 (A New Approach to Automatic Keyword Generation Using Inverse Vector Space Model)

  • 조원진;노상규;윤지영;박진수
    • Asia pacific journal of information systems
    • /
    • 제21권1호
    • /
    • pp.103-122
    • /
    • 2011
  • Recently, numerous documents have been made available electronically. Internet search engines and digital libraries commonly return query results containing hundreds or even thousands of documents. In this situation, it is virtually impossible for users to examine complete documents to determine whether they might be useful for them. For this reason, some on-line documents are accompanied by a list of keywords specified by the authors in an effort to guide the users by facilitating the filtering process. In this way, a set of keywords is often considered a condensed version of the whole document and therefore plays an important role for document retrieval, Web page retrieval, document clustering, summarization, text mining, and so on. Since many academic journals ask the authors to provide a list of five or six keywords on the first page of an article, keywords are most familiar in the context of journal articles. However, many other types of documents could not benefit from the use of keywords, including Web pages, email messages, news reports, magazine articles, and business papers. Although the potential benefit is large, the implementation itself is the obstacle; manually assigning keywords to all documents is a daunting task, or even impractical in that it is extremely tedious and time-consuming requiring a certain level of domain knowledge. Therefore, it is highly desirable to automate the keyword generation process. There are mainly two approaches to achieving this aim: keyword assignment approach and keyword extraction approach. Both approaches use machine learning methods and require, for training purposes, a set of documents with keywords already attached. In the former approach, there is a given set of vocabulary, and the aim is to match them to the texts. In other words, the keywords assignment approach seeks to select the words from a controlled vocabulary that best describes a document. Although this approach is domain dependent and is not easy to transfer and expand, it can generate implicit keywords that do not appear in a document. On the other hand, in the latter approach, the aim is to extract keywords with respect to their relevance in the text without prior vocabulary. In this approach, automatic keyword generation is treated as a classification task, and keywords are commonly extracted based on supervised learning techniques. Thus, keyword extraction algorithms classify candidate keywords in a document into positive or negative examples. Several systems such as Extractor and Kea were developed using keyword extraction approach. Most indicative words in a document are selected as keywords for that document and as a result, keywords extraction is limited to terms that appear in the document. Therefore, keywords extraction cannot generate implicit keywords that are not included in a document. According to the experiment results of Turney, about 64% to 90% of keywords assigned by the authors can be found in the full text of an article. Inversely, it also means that 10% to 36% of the keywords assigned by the authors do not appear in the article, which cannot be generated through keyword extraction algorithms. Our preliminary experiment result also shows that 37% of keywords assigned by the authors are not included in the full text. This is the reason why we have decided to adopt the keyword assignment approach. In this paper, we propose a new approach for automatic keyword assignment namely IVSM(Inverse Vector Space Model). The model is based on a vector space model. which is a conventional information retrieval model that represents documents and queries by vectors in a multidimensional space. IVSM generates an appropriate keyword set for a specific document by measuring the distance between the document and the keyword sets. The keyword assignment process of IVSM is as follows: (1) calculating the vector length of each keyword set based on each keyword weight; (2) preprocessing and parsing a target document that does not have keywords; (3) calculating the vector length of the target document based on the term frequency; (4) measuring the cosine similarity between each keyword set and the target document; and (5) generating keywords that have high similarity scores. Two keyword generation systems were implemented applying IVSM: IVSM system for Web-based community service and stand-alone IVSM system. Firstly, the IVSM system is implemented in a community service for sharing knowledge and opinions on current trends such as fashion, movies, social problems, and health information. The stand-alone IVSM system is dedicated to generating keywords for academic papers, and, indeed, it has been tested through a number of academic papers including those published by the Korean Association of Shipping and Logistics, the Korea Research Academy of Distribution Information, the Korea Logistics Society, the Korea Logistics Research Association, and the Korea Port Economic Association. We measured the performance of IVSM by the number of matches between the IVSM-generated keywords and the author-assigned keywords. According to our experiment, the precisions of IVSM applied to Web-based community service and academic journals were 0.75 and 0.71, respectively. The performance of both systems is much better than that of baseline systems that generate keywords based on simple probability. Also, IVSM shows comparable performance to Extractor that is a representative system of keyword extraction approach developed by Turney. As electronic documents increase, we expect that IVSM proposed in this paper can be applied to many electronic documents in Web-based community and digital library.