R dist function binary options


As medidas de distância disponíveis são (escritas para dois vetores x e y): Distância usual entre os dois vetores (2 norma aka L2), sqrt (soma ((xi - yi) 2)). Distância máxima entre duas componentes de x e y (norma suprema) Distância absoluta entre os dois vetores (1 norma aka L1). Soma (xi - yi / xi yi). Os termos com numerador zero e denominador são omitidos da soma e tratados como se os valores estivessem faltando. Isto é destinado a valores não negativos (por exemplo, contagens): tomar o valor absoluto do denominador é uma modificação de 1998 R para evitar distâncias negativas. (Aka binário assimétrico): Os vetores são considerados como bits binários, então elementos não-zero são lsquoonrsquo e zero elementos são lsquooffrsquo. A distância é a proporção de bits em que apenas um está entre aqueles em que pelo menos um está ligado. A p-norma, a p-ésima raiz da soma das p-ésimas potências das diferenças dos componentes. Os valores em falta são permitidos e são excluídos de todos os cálculos envolvendo as linhas em que ocorrem. Além disso, quando os valores de Inf estão envolvidos, todos os pares de valores são excluídos quando a sua contribuição para a distância deu NaN ou NA. Se algumas colunas são excluídas no cálculo de uma distância euclidiana, Manhattan, Canberra ou Minkowski, a soma é escalonada proporcionalmente ao número de colunas utilizadas. Se todos os pares forem excluídos ao calcular uma determinada distância, o valor é NA. O método dist de as. matrix () e as. dist () pode ser usado para conversão entre objetos de classe dist e matrizes de distância convencionais. As. dist () é uma função genérica. Seu método padrão manipula objetos herdados de classe dist. Ou coercible para matrizes usando as. matrix (). Suporte para classes representando distâncias (também conhecido como dissimilaridades) pode ser adicionado fornecendo um as. matrix () ou, mais diretamente, um método as. dist para essa classe. Valor dist retorna um objeto de classe dist. O triângulo inferior da matriz de distância armazenada por colunas em um vetor, digamos fazer. Se n é o número de observações, isto é, n lt-attr (do, Size). Então para i lt j le n. A dissimilaridade entre (linha) i e j é don (i-1) - i (i-1) / 2 j-i. O comprimento do vector é n (n-1) / 2. Isto é, de ordem n2. O objeto tem os seguintes atributos (além da classe igual a dist): inteiro, o número de observações no conjunto de dados.

Comments

Popular Posts