KNN —— 基本介绍与简要实现

阅读量：347 次

发布时间：2019-03-04

本文共 522 字，大约阅读时间需要 1 分钟。

KNN算法

介绍

KNN（K-Nearest Neighbors）是一种经典的分类算法，其基本思想是通过找到某个样本的K个最近邻来预测其类别。这种方法在数据局部进行分类，属于局部方法。

K值的选择至关重要，通常K取奇数以避免平票。例如，在二分类问题中，K常设为1、3、5等。算法步骤包括计算测试点与所有训练点的距离、排序后选择前K个最近点，并根据这些点的类别分布归类测试点。

实现步骤

计算距离：对于每个测试点，计算其到所有训练点的欧氏距离。

排序：对所有距离按从小到大排序，找出最近的K个点。

统计类别：统计前K个最近点中各类别的数量，选择数量最多的类别归类测试点。

案例分析

以鸢尾花数据集为例，数据包含四个特征：花萼长度、花萼宽度、花瓣长度、花瓣宽度。类别分为山鸢尾花（0）、变色鸢尾花（1）、维吉尼亚鸢尾花（2）。此处采用K=5进行分类。

通过上述算法，实现分类任务。代码使用sklearn中的鸢尾花数据集，切分训练集和测试集，应用KNN算法进行预测。最终结果表现在分类报告中，展示准确率、召回率及F1值等评估指标。

该方法具有高效性和简单性，但适用场景主要限于小规模数据集。对于大规模数据集，可能需要降维或使用其他优化技术以提高性能。

转载地址：http://hehe.baihongyu.com/

你可能感兴趣的文章

Nginx 我们必须知道的那些事

nginx 配置~~~本身就是一个静态资源的服务器

Nginx的是什么？干什么用的？

Nio ByteBuffer组件读写指针切换原理与常用方法

NI笔试——大数加法

NLP 基于kashgari和BERT实现中文命名实体识别（NER）

No 'Access-Control-Allow-Origin' header is present on the requested resource.

Node.js安装与配置指南：轻松启航您的JavaScript服务器之旅

NSSet集合无序的不能重复的

nullnullHuge Pages

Numpy如何使用np.umprod重写range函数中i的python

oauth2-shiro 添加 redis 实现版本

OAuth2.0_JWT令牌-生成令牌和校验令牌_Spring Security OAuth2.0认证授权---springcloud工作笔记148

OAuth2.0_JWT令牌介绍_Spring Security OAuth2.0认证授权---springcloud工作笔记147

OAuth2.0_介绍_Spring Security OAuth2.0认证授权---springcloud工作笔记137

OAuth2.0_完善环境配置_把资源微服务客户端信息_授权码存入到数据库_Spring Security OAuth2.0认证授权---springcloud工作笔记149

OAuth2.0_授权服务配置_Spring Security OAuth2.0认证授权---springcloud工作笔记140

OAuth2.0_授权服务配置_客户端详情配置_Spring Security OAuth2.0认证授权---springcloud工作笔记142

OAuth2.0_授权服务配置_密码模式及其他模式_Spring Security OAuth2.0认证授权---springcloud工作笔记145

OAuth2.0_授权服务配置_资源服务测试_Spring Security OAuth2.0认证授权---springcloud工作笔记146