1. 서론
농업은 고질적인 인력 부족 문제에 시달리고 있고 농촌은 지방 소멸 위기를 겪는 지역이 매우 빠르게 증가하고 있다. 국내 농가 수와 농가 인구 수는 지난 10년간 지속적으로 감소 있으며 고령화가 심화되고 있다. 통계청 농림어업조사에 따르면 2021년 농가 수는 103만 1천 가구, 농가 인구 수는 221만 5천 명으로 10년 전보다 10.4%와 23.9% 감소하였다. 또한, 고령화율은 전국 평균 고령화율 17.1%보다 2.7배 가량 높은 46.8%로 나타났다.
국내에서는 농업이 과거 2000년대 초반까지 지속적으로 성장해왔으나 최근 농가소득의 정체, 곡물자급률 하락, 농촌인구의 감소와 고령화, 더 나아가 기후변화 등으로 인한 어려움을 겪고 있으며, 농산물의 작황 및 생산량이 일정하지 않고, 가격의 등락도 반복되어 소비자인 국민의 안정적 먹거리 확보에 많은 어려움을 가지고 있다[1,2].
농인구 고령화, 젊은 층의 영농승계 인력난 및 생산 면적 감소, 투자위축 등에 따른 소득·수출·성장률 정체 등 지속가능성 위기에 처한 농촌문제 해결안으로 최근 스마트 팜이 큰 주목을 받고 있다.
스마트 팜은 작물 생육 정보와 환경정보 등에 대한 정확한 데이터를 기반으로 언제 어디서나 작물, 가축의 생육환경을 점검하고, 적기 처방을 함으로써 노동력·에너지 양분 등을 종전보다 덜 투입하고도 농산물의 생산성과 품질 제고가 가능한 지능화된 농장을 뜻한다. 인공 구조물 안에서 빛, 공기, 열, 양분 등 생육환경을 제어하고 날씨나 계절 변화에 상관없이 농산물을 생산하는 시스템을 구축한 게 특징이다. 그래서 생산 효율성과 재배 품질이 높으며, 채소 등 작물 가격이 사계절 일정하다는 장점도 있다. 화학비료를 쓰지 않고 물 사용량 역시 1/100 정도로 줄일 수 있다. 면적 대비 생산성은 기존 농장의 350배에 이른다[3]. 도시 소비자에게 빠르고 안전하게 농작물을 공급할 수 있는 것도 장점 중 하나로 꼽힌다.
6차 산업 혁명으로 불리는 스마트 팜 산업은 국내 농가 인구 감소와 농가 인구의 46.8%가 60대 이상의 고령층인 점을 감안할 때 ICT(Infor mation Communication Technology, BT(Biotechnology Technology)와의 접목을 통한 스마트 팜 산업의 경쟁력을 강화할 필요성이 있다. 혁신적인 농업의 ICT 기술 접목을 위해서 선행적인 연구나 특허에 대한 자료 수집 및 분석이 필수적이다.
본 논문은 키워드 네트워크 분석 방법을 통해 스마트 팜 관련 특허 연구의 방향을 알아본다. 국내에서 등록된 스마트 팜 관련 특허의 경향을 파악하기 위해 특허청이 보유한 국내 모든 지식재산권 정보를 보유하고 있는 특허정보검색서비스(KIPRISS)에서 ‘스마트 팜’으로 검색된 결과 중 특허데이터만 5,789개를 추출하여 네크워크 분석을 수행하였다. 본 연구를 통해 향후 어떤 연구주제에 관한 연구가 요구되는지 의미있는 시사점을 제공하고자 한다. 현재까지 진행된 스마트 팜과 관련된 특허데이터에 관한 제목을 파악하는 것은 향후 어떤 연구주제에 관한 탐구가 요구되는지 의미 있는 시사점을 제공할 것으로 생각된다.
본 연구를 위해 선정한 연구 문제는 다음과 같다.
연구 문제 1. 스마트 팜 관련 특허데이터 제목의 키워드 현황은 어떠한가?
연구 문제 2. 스마트 팜 관련 특허데이터의 키워드 네트워크 분석을 통한 특허 동향은 어떠한가?
연구 문제 3. 스마트 팜 관련 에고 네트워크이나 동시 출현 네트워크 상과 분석을 통해 스마트 팜 관련하여 연계된 연구 분야는 무엇인가?
2. 연구방법
본 논문은 2022년 7월까지의 스마트 팜 관련 특허의 경향을 파악하기 위해 유용한 키워드 네트워크 분석을 활용하였다. 키워드 네트워크를 분석함으로써 연구자들의 연구주제를 살펴보았으며, 키워드 간의 관계를 파악하였다.
2.1 분석대상
본 논문의 분석대상은 2022년 7월까지의 특허데이터 중 스마트 팜에 관해 연구한 특허데이터이다. 분석대상의 선정과정은 다음과 같다. 첫째, 특허청이 보유한 국내 모든 지식재산권 정보를 보유하고 있는 특허정보검색서비스에서 ‘스마트 팜’으로 검색된 국내 특허데이터를 조사하였다. 둘째, 검색된 데이터 중 특허데이터의 제목만을 선정하여 분석하였다.
2.2 키워드 추출 및 정제
기존 특허 관련 연구 부분에서는 빅데이터 관련 분석이나, 기술 예측을 위한 분석 등이 이루어져 있고[4-7], 네트워크 분석 부분에서는 COVID-19, 직업 능력개발 연구 경향, 뉴스 분석 등이고[8-10], 스마트 팜 관련 특허 네트워크 분석의 연구가 되어 있지 않았다. 본 논문은 6차 산업 혁명의 핵심인 스마트 팜 관련 특허 경향을 파악하려고 한다.
본 논문에서 키워드 추출은 R 프로그램을 사용하였다. 키워드는 연구자의 특허를 대표하고 핵심 주제를 담고 있으므로 본 논문에서는 각 저자가 제시한 특허데이터의 제목의 키워드를 중심으로 추출하였다. 본 논문은 검색된 5,789개의 특허데이터의 제목을 키워드로 정리하였다. 교정작업 과정에서는 띄어쓰기를 일괄 삭제하였고, 한글만 남겼으며, 형태소 분석기를 이용하여 품사를 기준으로 토큰화하여 행을 구성 후 품사를 추출하였다. 그 후, 명사, 동사, 형용사를 추출하여 추출한 데이터를 결합하였다.
3. 결과 및 해석
3.1 특허데이터 키워드 현황
2022년 7월까지 발표된 스마트 팜 관련 특허데이터 5,789개의 데이터를 살펴본 결과, 총 키워드수는 31,776개였다. 키워드 정제과정을 거친 후, 최종 선정된 스마트 팜 관련 특허데이터 제목의 주요 키워드는 6,033종이며, R프로그램을 이용하여 산출한 빈도분석 결과의 상위 16개의 결과는 표 1과 같다.
표 1. 주요 키워드의 빈도
Table 1. Frequency of key keywords
키워드의 빈도분석 결과를 살펴보면, ‘시스템’이 2,346회로 전체의 0.074%를 차지하고 있으며, 그 다음으로는 ‘방법’이 956회로 0.03%, ‘이용’ 이 647회로 0.02%를 나타내었다. 또한 ‘장치’가 568회로 0.018%, ‘기반’이 548회로 0.017%를 차지하며 그 뒤를 따랐다. 그 밖에도 ‘서비스’, ‘데이터’ 키워드 순으로 빈도수가 높게 나타났다. 그림 1은 이를 막대그래프로 시각화한 것이다.
그림 1. 주요 키워드의 빈도 막대그래프
Fig. 1. Frequency histogram of key keywords
키워드의 출현 빈도를 직관적으로 시각화하기 위하여 워드 출현 빈도가 높은 키워드를 크게, 출현 빈도가 낮은 키워드를 작게 표현해주는 워드 클라우드를 사용하여 시각화한 결과는 그림 2와 같다. 워드 클라우드에서도 ‘시스템’, ‘방법’, ‘장치’, ‘이용’ 등의 키워드가 크게 표현되는 것을 확인할 수 있다.
그림 2. 키워드의 워드 클라우드
Fig. 2. Word Cloud of Keywords
3.2 특허데이터 키워드 네트워크 분석
3.2.1 개별 노드 중심성 분석
전체 키워드에서 각 키워드별 어떠한 위치를 차지하고 있는지 알아보기 위해, 연결 중심성, 근접중심성, 매개 중심성, 고유 벡터 중심성을 분석하였다. 각 중심성별로 상위 20개의 키워드를 분석하였으며, 그 값은 다음의 표 2와 같다.
표 2. 키워드 네트워크 중심성
Table 2. Keyword network centrality
각 노드들이 얼마나 많은 이웃 노드를 가지고 있는지 나타내는 연결 중심성이 가장 높은 키워드는 ‘방법’(7)로 나타났으며, 다음으로 ‘프로그램’(5), ‘서비스’(5), ‘기반’(4) 순으로 높게 나타났다. 특정 노드에 다른 노드들이 얼마나 근접한지 나타내는 근접 중심성은 ‘운영’(1), ‘재배’(1), ‘활용’(1), ‘구축’(1)이 높게 나타났다. 한 노드가 다른 노드들과의 연결망을 구축하는 것에 얼마나 도움을 주는지 나타내는 매개 중심성은 ‘시스템’(105.616)이 가장 높게 나타났으며, ‘방법’(44.783), ‘이용’(44.616) 순으로 나타났다. 특정 노드와 연결된 노드가 중요한지를 나타내는 고유 벡터 중심성은 ‘시스템’(1)이 가장 높게 나타났으며, ‘이용’(0.705), ‘방법’(0.604), ‘스마트 팜’(0.573)순으로 높게 나타났다.
3.2.2 에고 네트워크 분석
3.2.2.1 ‘시스템’의 에고 네트워크 분석
‘시스템’은 스마트 팜 관련 특허데이터의 키워드 30개와 직접적인 관계를 맺고 있다. (표 3 참고) 그 중에서 ‘방법’과의 빈도가 472로 가장 높게 나타났다. 다음으로는 ‘이용’(343), ‘기반’(291) 등과 높은 빈도를 나타냈다. 즉, 스마트 팜 관련 특허데이터에서 ‘시스템’과 관련된 특허들은 주로 방법을 소개하였으며, 이용과 기반 등 무언가를 이용하고 무언가를 기반으로 하여 특허를 출원하는 것이 주로 이루어졌음을 알 수 있다. 동시 출현 빈도를 시각화하면 그림 3과 같다.
그림 3. ‘시스템’ 에고 네트워크
Fig. 3. ‘System’ ego network
표 3. ‘시스템’ 에고 네트워크의 주요 빈도
Table 3. The main frequency of the 'system’ ego network
3.2.2.2 ‘스마트 팜’의 에고 네트워크 분석
‘스마트 팜’은 스마트 팜 관련 특허데이터의 키워드 30개와 직접적인 관계를 맺고 있다. (표 4 참고) 그중에서 ‘시스템’과의 빈도가 472으로 가장 높게 나타났다. 다음으로는 ‘이용’(343), ‘제어’(291) 등과 높은 빈도를 나타냈다. 즉, 스마트 팜 관련 특허데이터에서 ‘스마트 팜’과 관련된 특허들은 주로 시스템을 소개하였으며, 이용과 제어 등 무언가를 이용하고 무언가를 제어하여 특허를 출원하는 것이 주로 이루어졌음을 알 수 있다. 동시 출현 빈도를 시각화하면 그림 4와 같다.
그림 4. ‘스마트 팜’ 에고 네트워크
Fig. 4. ‘Smart Farm’ ego network
표 4. ‘스마트 팜’ 에고 네트워크의 주요 빈도
Table 4. The main frequency of the 'Smart Farm’ ego network
3.2.2.3 ‘컴퓨터’의 에고 네트워크 분석
‘컴퓨터’는 스마트 팜 관련 특허데이터의 키워드 30개와 직접적인 관계를 맺고 있다. (표 5 참고) 그 중에서 ‘방법’과의 빈도가 112로 가장 높게 나타났다. 다음으로는 ‘시스템’(105), ‘프로그램’(69) 등과 높은 빈도를 나타냈다. 즉, 스마트 팜 관련 특허데이터에서 ‘컴퓨터’와 관련된 특허들은 주로 방법을 소개하였으며, 시스템과 프로그램 등 무언가에 사용되는 시스템과 프로그램을 특허로 출원하는 것이 주로 이루어졌음을 알 수 있다. 동시 출현 빈도를 시각화하면 그림 5와 같다.
그림 5. ‘컴퓨터’ 에고 네트워크
Fig. 5. ‘Computer’ ego network
표 5. ‘컴퓨터’ 에고 네트워크의 주요 빈도
Table 5. The main frequency of the 'Computer’ ego network
3.2.3 동시 출현 키워드 분석
전체 네트워크에서 스마트 팜과 관련된 주 키워드와 어떤 키워드가 함께 사용되었는지 알아보기 위하여 동시 출현 키워드를 분석하였다. 주 키워드는 ‘시스템’, ‘스마트 팜’, ‘컴퓨터’, ‘방법’으로 각 키워드별로 상위 10개의 키워드를 분석하였고 그 빈도수는 표 6과 같다.
표 6. 주요 키워드의 동시 출현 빈도
Table 6. Frequency of simultaneous appearance of key keywords
시스템과 관련된 키워드 중 가장 많은 빈도로 함께 사용된 키워드는 ‘방법’(472)로 나타났으며, 다음으로 ‘이용’(343), ‘기반’(2931) 순으로 높게 나타났다. 스마트 팜과 관련된 키워드 중 가장 많은 빈도로 함께 사용된 키워드는 ‘시스템’(100)로 나타났으며, ‘이용’(31), ‘장치’(15) 순으로 높게 나타났다. 컴퓨터와 관련된 키워드 중 가장 많은 빈도로 함께 사용된 키워드는 ‘시스템’(112)로 나타났으며, ‘방법’(105), ‘프로그램’(69) 순으로 높게 나타났다. 방법과 관련된 키워드 중 가장 많은 빈도로 함께 사용된 키워드는 ‘시스템’(472)로 나타났으며, ‘프로그램’(236), ‘이용’(166) 순으로 높게 나타났다.
3.2.4 동시 출현 네트워크 분석
본 논문에서는 스마트 팜 관련 특허데이터의 단어들이 어떤 맥락에서 함께 사용되었는지 파악하기 위해 단어의 동시 출현 빈도를 기준으로 데이터를 추출하였으며, 빈도가 35회 이상 사용된 단어를 대표 키워드로 선정하여, 이에 대한 동시 출현 네트워크 분석을 실행하였다. 동시 출현 네트워크란 특정 텍스트 단위에서 공동으로 출현한 단어의 집합적 상호 연결을 표현하는 방법으로 네트워크 연결망에서 노드는 단어, 엣지는 단어 연결선을 나타낸다.
스마트 팜 관련 특허데이터의 키워드에서 동시 출현 빈도가 가장 높은 키워드는 ‘방법’이었다. 본 논문에서는 스마트 팜 관련 특허데이터의 단어들 간 상호 연결을 파악하고자 하였다. 분석 결과는 그림 6과 같다. 분석 결과, 제일 많이 상호 연결된 키워드는 ‘방법’이며, 다음으로 ‘시스템’, ‘이용’ 순으로 나타났다. 표 7은 동시 출현 빈도 상위 9개를 표로 나타낸 것이다.
그림 6. 키워드의 동시 출현 네트워크
Fig. 6. Network of simultaneous emergence of keywords
표 7. 키워드의 동시 출현 빈도
Table 7. frequency of simultaneous appearance of keywords
3.2.5 키워드 간 상관 키워드 분석
전체 네트워크에서 스마트 팜과 관련된 상대적으로 관련성이 큰 단어가 무엇인지 알아보기 위하여 파이 계수를 분석하였다. 파이 계수(phi coeffcient)란 두 단어가 함께 사용되는 경우가 각각 사용되는 경우에 비해 얼마나 많은지 나타낸 지표이다. 주 키워드는 ‘시스템’, ‘스마트 팜’, ‘컴퓨터’, ‘방법’으로 각 키워드별로 상위 8개의 키워드를 분석하였고 그림 7은 분석한 자료를 막대그래프로 시각화한 것이다.
그림 7. 키워드 간 상관분석 막대그래프
Fig. 7. Correlation between keywords histogram
시스템과 관련된 키워드 중 상대적으로 자주 함께 사용된 키워드는 ‘관리’(0.105)로 나타났으며, 다음으로 ‘컴퓨터화’(0.092), ‘이용’(0.09) 순으로 높게 나타났다. 스마트 팜과 관련된 키워드 중 상대적으로 자주 함께 사용된 키워드는 ‘제어’(0.112)로 나타났으며, 다음으로 ‘운영’(0.108), ‘재배’(0.089) 순으로 높게 나타났다. 컴퓨터와 관련된 키워드 중 상대적으로 자주 함께 사용된 키워드는 ‘구현’(0.401) 나타났으며, 다음으로 ‘기록’(0.394), ‘판독가능’(0.344) 순으로 높게 나타났다. 방법과 관련된 키워드 중 상대적으로 자주 함께 사용된 키워드는 ‘프로그램’(0.389)으로 나타났으며, 다음으로 ‘기록’(0.212), ‘기록매체’(0.208) 순으로 높게 나타났다.
3.2.6 바이그램 키워드 분석
전체 네트워크에서 스마트 팜과 관련된 주 키워드와 어떤 키워드가 얼마나 자주 연이어 사용되었는지 알아보기 위하여 바이그램 키워드를 분석하였다. 주 키워드는 ‘스마트 팜’으로 키워드의 상위 10개의 키워드를 동시 출현 단어쌍과 바이그램 단어쌍을 분석하였고 그 결과는 표 8과 같다.
표 8. ‘스마트 팜’의 동시 출현 단어쌍과 바이그램 단어쌍 비교
Table 8. Simultaneous appearance of 'smart farm' Comparison of word pairs and bigram word pairs
스마트 팜과 관련된 키워드 중 가장 많은 빈도로 함께 사용된 키워드는 ‘시스템’(109)으로 나타났으며, 다음으로 ‘이용’(39), ‘제어’(19) 순으로 높게 나타났다. 스마트 팜과 관련된 키워드 중 가장 많은 빈도로 연이어 사용된 키워드는 ‘시스템’(43)으로 나타났으며, 다음으로 ‘운영’(12), ‘제어’(9) 순으로 높게 나타났다.
3.2.7 바이그램 네트워크 분석
본 논문에서는 스마트 팜 관련 특허데이터의 단어들이 어떤 맥락에서 연이어 사용되었는지 파악하기 위해 연이어 사용된 2개의 단어의 빈도를 기준으로 데이터를 추출하였으며, 빈도가 18회 이상 연이어 사용된 단어를 대표 키워드로 선정하여, 이에대한 바이그램 네트워크 분석을 실행하였다. 바이그램 네트워크란 특정 텍스트 단위에서 연속으로 출현한 단어의 집합적 상호 연결을 표현하는 방법으로 네트워크 연결망에서 엣지의 명암과 두께는 단어 간 바이그램 빈도를 나타내며 진하고 두꺼울수록 빈도가 잦음을 나타낸다. 그림 8는 스마트 팜 관련 특허 데이터의 단어 간 바이그램 상호 연결 분석 결과를 네트워크로 시각화한 것이다. 스마트 팜 관련 특허 데이터의 키워드에서 바이그램 빈도가 가장 높은 키워드는 ‘방법’과 ‘시스템’이며 다음으로는 ‘방법’과 ‘프로그램’, ‘관리’와 ‘시스템’ 순으로 나타났다.
그림 8. 키워드의 바이그램 네트워크
Fig. 8. Keyword Bigram Network
4. 결론
농업의 본질적인 문제인 인력 문제와 고령화 문제를 해결하는 방안 중 스마트 팜은 최근 크게 주목받고 있다. 6차 산업 혁명이라고 불리는 스마트 팜은 농가 인구의 46.8%가 60대 이상의 고령층으로 볼 때 스마트 팜은 산업은 경쟁력을 강화 할 필요성이 있다. 혁신 가능한 ICT 기술을 농업에 접목하기 위해서 선행적으로 연구나 특허에 대한 자료 수집 및 분석이 필수적이다.
본 논문에서는 KIPRIS 특허 정보 검색서비스를 이용하여 스마트 팜과 관련된 5,789건의 특허데이터의 제목을 추출하여 연구 동향을 살펴보았다. 특허데이터들의 연구 동향을 분석하기 위해, 빈도분석, 에고 네트워크, 동시 출현 빈도분석, 바이그램 네트워크 등을 적용하였다.
스마트 팜 관련 특허데이터는 제목의 키워드를 분석한 결과 스마트 관련된 ‘시스템’이 서비스나, 데이터, 관리 등 다른 키워드보다 상대적으로 많았다. 즉, 스마트 팜 관련에서는 시스템이 가장 많이 연관되어 특허가 출현되는 동향이 있었다. 또한 전체 키워드에서 각 키워드별 위치분석을 파악하기 위해 연결 중심성과 근접 중심성, 매개 중심성, 고유 벡터 중심성을 분석하였다. 스마트 팜 관련 중심성을 분석한 결과도 ‘시스템’이 가장 높게 나타났다. 시스템에 대한 에고 네트워크를 보면 ‘제어’과 ‘제공’ 순으로 나타났다. 스마트 팜 관련 동시 출현 빈도수는 ‘시스템’, ‘방법’, ‘이용’ 순으로 나타났다. 스마트 팜과 자주 연이어 사용되는 단어는 ‘시스템’이 가장 높았으며, 그 다음으로 ‘이용’과 ‘제어’ 등의 순이었다. 2개의 빈도를 기준으로 수행되는 바이그램 네트워크 분석에서는 ‘시스템’과 ‘방법’이 가장 높았으면 그다음으로 ‘방법’과 ‘프로그램’순으로 나타났다.
결론적으로 스마트 팜 관련 특허를 네트워크 분석한 결과, ‘시스템’이 가장 높게 관련된 단어로 나타났다. 즉, 스마트 팜 관련하여 시스템을 이용하거나 시스템을 제어 기술하는 관련된 특허가 가장 많았음을 알 수 있다.
References
- S. H. Yoon, M. H. Choi, J. Y. Park, "Data-driven smart farm prospects", Proceedings of the Conference on Communications and Information Sciences, Vol.2022, No.2, pp. 930-931, 2022.
- S. K. Park, "Trends and Development of Smart Farms", Proceedings of the Conference on Korean Society for Food Engineering, Vol.2017, No.11, pp. 49-78, 2017.
- http://www.kidshankook.kr/news/articleView.html?idxno=1316
- J. H. Shin, "Design and Implementation of Patent Analysis System Based on Big data", DataBase Research, Vol.33, No.1, pp. 92-104, 2017.
- H. Kim, D. G. Kim, J. N. Jo, "Patent data analysis using clique analysis in a keyword network", Journal of the Korean data & information science society, Vo1.27, No.5, pp. 1273-1284, 2016.
- J. H. Choi, H. S. Kim, N. G. Im, "Keyword Network Analysis for Technology Forecasting", Journal of Intelligence and Information Systems, Vo1.17, No.4, pp. 227-240, 2011. https://doi.org/10.13088/JIIS.2011.17.4.227
- Y. G. Hyun, J. H. Han, U. R. Chae, G. H. Lee, J. Y. Lee, "A Study On Technical Trend Analysis Related to Semantic Analysis of NLP Through Domestic/Foreign Patent Data", Journal of Digital Convergence, Vol.18, No.1, pp. 137-146, 2020. https://doi.org/10.14400/JDC.2020.18.1.137
- G. J. Jo, "Research Trends in Early Childhood Education and Care during COVID-19 through Keyword Network Analysis", Early Childhood Education Collection, Vol.26, No.3, pp. 157-180, 2022.
- S. Y. Yoo, G. G. Lim, "Analysis of the news agenda using text mining and semantic network analysis: Focusing on COVID-19-related emotions", Journal of Intelligence and Information Systems, Vol.27, No.1, pp. 47-64, 2021. https://doi.org/10.13088/JIIS.2021.27.1.047
- S. H. Jung, Y. D. Ho, Y. S. Song, "Exploration of HRD Research Trends through Keyword Network Analysis", The Korean Journal of Human Resource Development, Vol.16, No.3, pp. 1-33, 2014.