KNN智能分類算法的基本思想是計算訓練樣本和新樣板之間的距離,然后找到最近的 K 個相鄰樣本數(shù)據(jù),根據(jù)這些相鄰樣本數(shù)據(jù),來判定新的樣本類別。如果屬于同一類,則判定樣本屬于這個類別; 如果不屬于這個類別,則對候選類別進行評分,按照規(guī)則確定新樣本的類別。最后,把新的測試樣本歸類到最近的 K 個訓練樣本中出現(xiàn)頻率最大的。使用 KNN算法分類是基于臨近樣本數(shù)據(jù)具有類似的預測值,基本思想是在多維空間 Rn中搜索未知樣本,找到與未知樣本最近鄰的 K 個點,并根據(jù) K 個點來判斷未知的樣本數(shù)據(jù)。這 K 個點便是待分類樣本的 k - 最近鄰。綜合上述過程,對基于 KNN 算法的農(nóng)機虛擬云制造系統(tǒng)設計過程如下:1) 尋找合適的農(nóng)機部件制造服務候選資源訓練數(shù)據(jù)集。農(nóng)機部件制造服務候選資源訓練數(shù)據(jù)集需要對歷史數(shù)據(jù)具有很好的覆蓋功能,這樣才有利于對近鄰的預測。選取的訓練數(shù)據(jù)要有代表性,既要保證訓練樣本數(shù)據(jù)集的大小,又要保證數(shù)據(jù)集的精度。2) 確定距離函數(shù)。距離函數(shù)的選取比較重要,決定哪些服務候選資源是 K 個待分類的近鄰,其選取取決于實際的數(shù)據(jù)和決策。如果樣本是空間上分布的點,則可以選用歐幾里得距離。3) 決定 K 取值。K 值的選取對分類影響較大,一般可以初始確定一個值,通過不斷調(diào)試,得到合適的值。4) 確定候選資源的類別。候選資源的最終確定可以根據(jù)類別中出現(xiàn)頻率最高的來選擇,如果最高的不只一個,可以選擇最近鄰的。農(nóng)機部件制造服務候選資源的選擇,可以有效地縮短農(nóng)機制造的整個設計和加工流程,從而提高農(nóng)機現(xiàn)代化設計和制造的效率。