Knn para classificação de Breast Cancer Patients
Você vai agora aplicar do modelo Knn dataframe biopsy (MASS). Após executar o comando library(MASS) você pode executar o coamndo help(biopsy) para conhecer mais sobre esse conjunto de dados. Ele traz dados sobre biopsias e classifica seus resultados como benignos e malignos.
Você vai aplicar o modelo Knn após explorar o dataframe biopsy. Você deve inspecionar se existem atributos que não podem ser aplicados, se existe necessidade de normalização ou transformação dos dados, tratar dados faltantes se houverem e experimentar diferentes valores de k calculando a acuracidade obtida sobre um conjunto de testes. Ao final você escolherá um melhor modelo.
Empregaremos 1/3 de dados de teste e, neste exercício você de fazer a média de 100 diferentes execuções para obter a acuracidade.
POSTANDO O CÓDIGO
1. O código empregado deve ser postado em formato .PDF (a tarefa não permite postar extensões de arquivos diferentes).
2. O código precisa ser executável. O conteúdo pode ser copiado do .pdf aplicado para execução diretamente no RStudio sem a necessidade de quaisquer arquivos ou imports.
3. Em alguns casos o código não precisa trazer todas as respostas. Por exemplo, se vamos executar para k=2, 5 e 12, o código pode estar referenciando apenas o k=12 e sendo substituído seu valor para as demais execuções.
DICAS
1. Para obter a média de 100 diferentes execuções empregue o comando for (1 in 1:100) e não fixe o seed!
2. Comandos que você pode achar útil neste exercício [login to view URL](), summary(), attach()
3. Para obter os elementos de teste empregue: L <- sample(1:nrow(df),round(nrow(df)/3))
*Empregue o RStudio com o library(class) e library(MASS)