dbo:abstract
|
- La similitud cosinus és una mesura de la similitud existent entre dos vectors en un espai que posseeix un producte interior amb el qual s'avalua el valor del cosinus de l'angle comprès entre ells. Aquesta funció trigonomètrica proporciona un valor igual a 1 si l'angle comprès és zero, és a dir si tots dos vectors apunten a un mateix lloc. Per qualsevol angle existent entre els vectors, el cosinus donaria un valor inferior a un. Si els vectors fossin ortogonals el cosinus s'anul·laria i donaria 0, i si apuntessin en sentit contrari el seu valor seria -1. D'aquesta forma, el valor d'aquesta mètrica es troba entre -1 i 1, és a dir en l'interval tancat [-1,1]. Aquesta distància s'utilitza freqüentment en la cerca i recuperació d'informació representant les paraules (o document) en un espai vectorial. En mineria de textos s'aplica la similitud cosinus amb l'objecte d'establir una mètrica de semblança entre textos. En mineria de dades se sol utilitzar com un indicador de cohesió de clústers de textos. La similitud cosinus no ha de ser considerada com una mètrica a causa que no compleix la desigualtat triangular. (ca)
- Kosinus-Ähnlichkeit ist ein Maß für die Ähnlichkeit zweier Vektoren. Dabei wird der Kosinus des Winkels zwischen beiden Vektoren bestimmt. Der Kosinus des eingeschlossenen Nullwinkels ist eins; für jeden anderen Winkel ist der Kosinus des eingeschlossenen Winkels kleiner als eins. Er ist daher ein Maß dafür, wie ausgeprägt zwei Vektoren in die gleiche Richtung zeigen. Typische Anwendungen finden sich im Vergleich von Dokumenten, von Multimedia-Objekten, im Textmining, im Data-Mining, im Auffinden von Plagiaten, bei Suchmaschinen oder in der Kryptographie bei der Entschlüsselung chiffrierter Texte. Durch Ermittlung der Kosinus-Ähnlichkeit der Zeichen-Platzierungsvektoren gelang 2011 die Entschlüsselung des Codex Copiale, eines Dokuments in Geheimschrift. Im Englischen werden neben der wortwörtlichen Übersetzung „Cosine Similarity“ auch die Begriffe „Cosine Distance“, „Angular Cosine Distance“ und „Angular Cosine Similarity“ verwendet. (de)
- In data analysis, cosine similarity is a measure of similarity between two sequences of numbers. For defining it, the sequences are viewed as vectors in an inner product space, and the cosine similarity is defined as the cosine of the angle between them, that is, the dot product of the vectors divided by the product of their lengths. It follows that the cosine similarity does not depend on the magnitudes of the vectors, but only on their angle. The cosine similarity always belongs to the interval For example, two proportional vectors have a cosine similarity of 1, two orthogonal vectors have a similarity of 0, and two opposite vectors have a similarity of -1. The cosine similarity is particularly used in positive space, where the outcome is neatly bounded in . For example, in information retrieval and text mining, each word is assigned a different coordinate and a document is represented by the vector of the numbers of occurrences of each word in the document. Cosine similarity then gives a useful measure of how similar two documents are likely to be, in terms of their subject matter, and independently of the length of the documents. The technique is also used to measure cohesion within clusters in the field of data mining. One advantage of cosine similarity is its low complexity, especially for sparse vectors: only the non-zero coordinates need to be considered. Other names for cosine similarity include Orchini similarity and Tucker coefficient of congruence; the Otsuka–Ochiai similarity (see below) is cosine similarity applied to binary data. (en)
- La similitud coseno es una medida de la similitud existente entre dos vectores en un espacio que posee un producto interior con el que se evalúa el valor del coseno del ángulo comprendido entre ellos. Esta función trigonométrica proporciona un valor igual a 1 si el ángulo comprendido es cero, es decir si ambos vectores apuntan a un mismo lugar. Cualquier ángulo existente entre los vectores, el coseno arrojaría un valor inferior a uno. Si los vectores fuesen ortogonales el coseno se anularía, y si apuntasen en sentido contrario su valor sería -1. De esta forma, el valor de esta métrica se encuentra entre -1 y 1, es decir en el intervalo cerrado [-1,1]. Esta distancia se emplea frecuentemente en la búsqueda y recuperación de información representando las palabras (o documento) en un espacio vectorial. En minería de textos se aplica la similitud coseno con el objeto de establecer una métrica de semejanza entre textos. En minería de datos se suele emplear como un indicador de cohesión de clústeres de textos. La similitud coseno no debe ser considerada como una métrica debido a que no cumple la desigualdad triangular. (es)
- La similarité cosinus donne la similarité de deux vecteurs à n dimensions en déterminant le cosinus de leur angle. Ce score est fréquemment utilisée en fouille de textes. Soit deux vecteurs A et B, le cosinus de leur angle θ s'obtient en prenant leur produit scalaire divisé par le produit de leurs normes : . La valeur d'un cosinus, donc celle calculée ici pour cos θ, est comprise dans l'intervalle [-1,1]. La valeur de -1 indique des vecteurs opposés, la valeur de 0 des vecteurs indépendants (orthogonaux) et la valeur de 1 des vecteurs colinéaires de coefficient positif. Les valeurs intermédiaires permettent d'évaluer le degré de similarité. (fr)
- La similarità del coseno, o cosine similarity, è una tecnica euristica per la misurazione della similitudine tra due vettori effettuata calcolando il coseno tra di loro, usata generalmente per il confronto di testi nell'estrazione di dati e nell'analisi testuale. (it)
- 코사인 유사도(― 類似度, 영어: cosine similarity)는 내적공간의 두 벡터간 각도의 코사인값을 이용하여 측정된 벡터간의 유사한 정도를 의미한다. 각도가 0°일 때의 코사인값은 1이며, 다른 모든 각도의 코사인값은 1보다 작다. 따라서 이 값은 벡터의 크기가 아닌 방향의 유사도를 판단하는 목적으로 사용되며, 두 벡터의 방향이 완전히 같을 경우 1, 90°의 각을 이룰 경우 0, 180°로 완전히 반대 방향인 경우 -1의 값을 갖는다. 이 때 벡터의 크기는 값에 아무런 영향을 미치지 않는다. 코사인 유사도는 특히 결과값이 [0,1]의 범위로 떨어지는 양수 공간에서 사용된다. 코사인 유사도는 어떤 개수의 차원에도 적용이 가능하여 흔히 다차원의 양수 공간에서의 유사도 측정에 자주 이용된다. 예를 들어 정보 검색 및 분야에서, 단어 하나 하나는 각각의 차원을 구성하고 문서는 각 단어가 문서에 나타나는 회수로 표현되는 벡터값을 가진다. 이러한 다차원 공간에서 코사인 유사도는 두 문서의 유사를 측정하는 매우 유용한 방법이다. 코사인 유사도는 데이터 마이닝 분야에서 클러스터들간의 응집도를 측정하는 방법으로도 사용된다. 코사인 거리(cosine distance)라는 개념이 대신 사용되기도 하는데, 이는 으로 표현된다. 단, 코사인 거리는 삼각부등식의 성질을 갖고 있지 않으며 코사인 공리도 만족하지 않기 때문에 정확한 거리 함수로 사용할 수는 없다. 순서를 유지하면서 삼각부등식 성질을 만족시키기 위해서는 각거리를 이용해야 한다.(정의 항목 참조) 코사인 유사도가 널리 사용되는 이유 중 하나는 이것이 양수 공간이라는 조건만 만족하면 얼마나 많은 차원 공간에서든지 거리를 측정하는 것이 가능하기 때문이다. (ko)
- De cosinusgelijkenis is een waarde waarmee de gelijkenis tussen twee vectoren kan worden aangeduid. Het is in feite de cosinus van de hoek tussen twee vectoren (in inwendig-productruimte). Vectoren die in exact dezelfde richting liggen hebben een cosinusgelijkenis van 1, terwijl twee vectoren die loodrecht op elkaar staan een cosinusgelijkenis van 0 hebben. De cosinusgelijkenis wordt gebruikt om uit te rekenen in hoeverre documenten of andere objecten op elkaar lijken. Men gebruikt daarvoor een dimensie om een woord (of andere eigenschap) te representeren. Als twee documenten veel samenhang hebben, zal de waarde dicht bij de 1 liggen, terwijl bij weinig samenhang de waarde dicht bij 0 zal liggen. Aangezien het aantal voorkomens van een woord in een document niet negatief kan zijn, kan de cosinusgelijkenis niet negatief zijn en is het bereik normaal gesproken [0,1]. De gelijkheid kan als volgt worden uitgerekend, waarbij en twee vectoren (bijvoorbeeld twee documenten met woorden) voorstellen: . (nl)
- A similaridade por cosseno é uma medida da similareda de entre dois vetores num espaço vetorial que avalia o valor do cosseno do ângulo compreendido entre eles. Esta função trigonométrica proporciona um valor igual a 1 se o ângulo compreendido é zero, isto é se ambos vetores apontam a um mesmo lugar. Para qualquer ângulo diferente de 0, o valor de cosseno é inferior a um. Se os vetores fossem ortogonais o cosseno anular-se-ia, e se apontassem em sentido contrário seu valor seria -1. Desta forma, o valor desta métrica encontra-se entre -1 e 1, isto é no intervalo fechado [-1,1]. Esta distância emprega-se frequentemente na busca e recuperação de informação representando as palavras (ou documento) num espaço vectorial. Em mineração de textos aplica-se a similaridade por cosseno para de estabelecer uma métrica de semelhança entre textos. Em mineração de dados costuma-se empregar como um indicador de coesão de clústeres de textos. A similaridade por cosseno não deve ser considerada como uma métrica de distancia pois não cumpre a desigualdade triangular. (pt)
- Косинус подібності (англ. cosine similarity) — коефіцієнт подібності двох не нульових векторів у предгільбертовому просторі, який обчислюється як косинус кута між ними. Косинус 0° дорівнює 1, а для всіх інших значень кута в інтервалі (0,π] буде менше за 1. Отож, це оцінка напрямку, а не величини: два вектори з однаковим напрямком мають косинус подібності 1, а два вектора, які утворюють кут 90° один відносно одного, мають подібність 0, а два діаметрально направлені вектори мають подібність -1, незалежно від їх довжини. Косинус подібності часто використовують в позитивному просторі, для якого результат обмежений проміжком . Назва походить від терміну «направлений косинус»: в цьому випадку одиничні вектори максимально «подібні», якщо вони паралельні і максимально «різні», якщо вони ортогональні (перпендикулярні). Це аналогічно косинусу, який є одиницею (максимальне значення), коли відрізки утворюють нульовий кут і нулем (не корельовані), коли відрізки ортогональні. Ці межі застосовуються до будь-якої кількості вимірів, але найчастіше косинус подібності використовується у багатовимірних додатних просторах. Наприклад, при інформаційному пошуку та аналізі тексту, кожен термін пов'язаний з окремим виміром, і тому документ характеризується вектором, де значення кожного виміру відповідає кількості разів, що термін з'являється у документі. Тоді косинус подібності дає корисну оцінку того, наскільки подібні два документи у термінах теми. Ця методика також використовується при добуванні даних для вимірювання згрупованості всередині кластерів. Вираз відстань з косинусом часто використовують як доповнення у додатному просторі, а саме: де — відстань з косинусом, а — косинус подібності. Однак, варто зауважити, що це не є метрикою, бо не виконується нерівність трикутника або, більш формально, нерівність Коші — Буняковського, що порушує аксіому збіжності. Для того, щоб виконувалась нерівність трикутника, необхідно перейти до кутової відстані. Однією з переваг косинуса подібності є низька складність обчислення, особливо для розріджених векторів: достатньо брати лише координати з ненульовим значенням. Для косинуса подібності також використовуються інші назви, такі як подібність Орчині (англ. Orchini) або коефіцієнт Тукера (англ. Tucker). Подібність Очиаї (англ. Ochiai) — це косинус подібності застосований до бінарних даних. (uk)
- Коэффициент Отиаи (мера Отиаи, коэффициент Оцуки — Отиаи, коэффициент Отиаи — Баркмана, косинусный коэффициент, геометрический коэффициент) — бинарная мера сходства, предложенная японским биологом Акирой Отиаи в 1957 году, в дальнейшем обобщенная и нашедшая применение в разнообразных приложениях и за рамками биологии. В стандартном определении коэффициент для двух произвольных множеств и вводится следующим образом: , где — мощность множества . Часто используется мера Отиаи, возведённая в квадрат: . Для случая дескриптивных множеств коэффициент Отиаи вычисляется следующим образом: , такая мера широко используется в экологии для выборок по обилию. Если сравниваются объекты по встречаемости видов (вероятностная интерпретация), то есть учитываются вероятности — относительные числа выборок, на которых встречается вид, то коэффициент вычисляется по совместимости событий: . (ru)
- 余弦相似性通过测量两个向量的夹角的余弦值来度量它们之间的相似性。0度角的余弦值是1,而其他任何角度的余弦值都不大于1;并且其最小值是-1。从而两个向量之间的角度的余弦值确定两个向量是否大致指向相同的方向。两个向量有相同的指向时,余弦相似度的值为1;两个向量夹角为90°时,余弦相似度的值为0;两个向量指向完全相反的方向时,余弦相似度的值为-1。這結果是與向量的長度無關的,仅仅與向量的指向方向相關。余弦相似度通常用于正空間,因此給出的值为0到1之间。 注意這上下界对任何维度的向量空間中都適用,而且余弦相似性最常用於高维正空间。例如在信息检索中,每个词項被賦予不同的維度,而一个文档由一个向量表示,其各個維度上的值對應于該词項在文档中出现的频率。余弦相似度因此可以给出两篇文档在其主题方面的相似度。 另外,它通常用于文本挖掘中的文件比较。此外,在数据挖掘领域中,會用到它来度量集群内部的凝聚力。 (zh)
|
rdfs:comment
|
- La similarità del coseno, o cosine similarity, è una tecnica euristica per la misurazione della similitudine tra due vettori effettuata calcolando il coseno tra di loro, usata generalmente per il confronto di testi nell'estrazione di dati e nell'analisi testuale. (it)
- 余弦相似性通过测量两个向量的夹角的余弦值来度量它们之间的相似性。0度角的余弦值是1,而其他任何角度的余弦值都不大于1;并且其最小值是-1。从而两个向量之间的角度的余弦值确定两个向量是否大致指向相同的方向。两个向量有相同的指向时,余弦相似度的值为1;两个向量夹角为90°时,余弦相似度的值为0;两个向量指向完全相反的方向时,余弦相似度的值为-1。這結果是與向量的長度無關的,仅仅與向量的指向方向相關。余弦相似度通常用于正空間,因此給出的值为0到1之间。 注意這上下界对任何维度的向量空間中都適用,而且余弦相似性最常用於高维正空间。例如在信息检索中,每个词項被賦予不同的維度,而一个文档由一个向量表示,其各個維度上的值對應于該词項在文档中出现的频率。余弦相似度因此可以给出两篇文档在其主题方面的相似度。 另外,它通常用于文本挖掘中的文件比较。此外,在数据挖掘领域中,會用到它来度量集群内部的凝聚力。 (zh)
- La similitud cosinus és una mesura de la similitud existent entre dos vectors en un espai que posseeix un producte interior amb el qual s'avalua el valor del cosinus de l'angle comprès entre ells. Aquesta funció trigonomètrica proporciona un valor igual a 1 si l'angle comprès és zero, és a dir si tots dos vectors apunten a un mateix lloc. Per qualsevol angle existent entre els vectors, el cosinus donaria un valor inferior a un. Si els vectors fossin ortogonals el cosinus s'anul·laria i donaria 0, i si apuntessin en sentit contrari el seu valor seria -1. D'aquesta forma, el valor d'aquesta mètrica es troba entre -1 i 1, és a dir en l'interval tancat [-1,1]. (ca)
- In data analysis, cosine similarity is a measure of similarity between two sequences of numbers. For defining it, the sequences are viewed as vectors in an inner product space, and the cosine similarity is defined as the cosine of the angle between them, that is, the dot product of the vectors divided by the product of their lengths. It follows that the cosine similarity does not depend on the magnitudes of the vectors, but only on their angle. The cosine similarity always belongs to the interval For example, two proportional vectors have a cosine similarity of 1, two orthogonal vectors have a similarity of 0, and two opposite vectors have a similarity of -1. The cosine similarity is particularly used in positive space, where the outcome is neatly bounded in . (en)
- Kosinus-Ähnlichkeit ist ein Maß für die Ähnlichkeit zweier Vektoren. Dabei wird der Kosinus des Winkels zwischen beiden Vektoren bestimmt. Der Kosinus des eingeschlossenen Nullwinkels ist eins; für jeden anderen Winkel ist der Kosinus des eingeschlossenen Winkels kleiner als eins. Er ist daher ein Maß dafür, wie ausgeprägt zwei Vektoren in die gleiche Richtung zeigen. Im Englischen werden neben der wortwörtlichen Übersetzung „Cosine Similarity“ auch die Begriffe „Cosine Distance“, „Angular Cosine Distance“ und „Angular Cosine Similarity“ verwendet. (de)
- La similitud coseno es una medida de la similitud existente entre dos vectores en un espacio que posee un producto interior con el que se evalúa el valor del coseno del ángulo comprendido entre ellos. Esta función trigonométrica proporciona un valor igual a 1 si el ángulo comprendido es cero, es decir si ambos vectores apuntan a un mismo lugar. Cualquier ángulo existente entre los vectores, el coseno arrojaría un valor inferior a uno. Si los vectores fuesen ortogonales el coseno se anularía, y si apuntasen en sentido contrario su valor sería -1. De esta forma, el valor de esta métrica se encuentra entre -1 y 1, es decir en el intervalo cerrado [-1,1]. (es)
- La similarité cosinus donne la similarité de deux vecteurs à n dimensions en déterminant le cosinus de leur angle. Ce score est fréquemment utilisée en fouille de textes. Soit deux vecteurs A et B, le cosinus de leur angle θ s'obtient en prenant leur produit scalaire divisé par le produit de leurs normes : . (fr)
- 코사인 유사도(― 類似度, 영어: cosine similarity)는 내적공간의 두 벡터간 각도의 코사인값을 이용하여 측정된 벡터간의 유사한 정도를 의미한다. 각도가 0°일 때의 코사인값은 1이며, 다른 모든 각도의 코사인값은 1보다 작다. 따라서 이 값은 벡터의 크기가 아닌 방향의 유사도를 판단하는 목적으로 사용되며, 두 벡터의 방향이 완전히 같을 경우 1, 90°의 각을 이룰 경우 0, 180°로 완전히 반대 방향인 경우 -1의 값을 갖는다. 이 때 벡터의 크기는 값에 아무런 영향을 미치지 않는다. 코사인 유사도는 특히 결과값이 [0,1]의 범위로 떨어지는 양수 공간에서 사용된다. 코사인 유사도는 어떤 개수의 차원에도 적용이 가능하여 흔히 다차원의 양수 공간에서의 유사도 측정에 자주 이용된다. 예를 들어 정보 검색 및 분야에서, 단어 하나 하나는 각각의 차원을 구성하고 문서는 각 단어가 문서에 나타나는 회수로 표현되는 벡터값을 가진다. 이러한 다차원 공간에서 코사인 유사도는 두 문서의 유사를 측정하는 매우 유용한 방법이다. 코사인 유사도는 데이터 마이닝 분야에서 클러스터들간의 응집도를 측정하는 방법으로도 사용된다. (ko)
- De cosinusgelijkenis is een waarde waarmee de gelijkenis tussen twee vectoren kan worden aangeduid. Het is in feite de cosinus van de hoek tussen twee vectoren (in inwendig-productruimte). Vectoren die in exact dezelfde richting liggen hebben een cosinusgelijkenis van 1, terwijl twee vectoren die loodrecht op elkaar staan een cosinusgelijkenis van 0 hebben. De gelijkheid kan als volgt worden uitgerekend, waarbij en twee vectoren (bijvoorbeeld twee documenten met woorden) voorstellen: . (nl)
- A similaridade por cosseno é uma medida da similareda de entre dois vetores num espaço vetorial que avalia o valor do cosseno do ângulo compreendido entre eles. Esta função trigonométrica proporciona um valor igual a 1 se o ângulo compreendido é zero, isto é se ambos vetores apontam a um mesmo lugar. Para qualquer ângulo diferente de 0, o valor de cosseno é inferior a um. Se os vetores fossem ortogonais o cosseno anular-se-ia, e se apontassem em sentido contrário seu valor seria -1. Desta forma, o valor desta métrica encontra-se entre -1 e 1, isto é no intervalo fechado [-1,1]. (pt)
- Косинус подібності (англ. cosine similarity) — коефіцієнт подібності двох не нульових векторів у предгільбертовому просторі, який обчислюється як косинус кута між ними. Косинус 0° дорівнює 1, а для всіх інших значень кута в інтервалі (0,π] буде менше за 1. Отож, це оцінка напрямку, а не величини: два вектори з однаковим напрямком мають косинус подібності 1, а два вектора, які утворюють кут 90° один відносно одного, мають подібність 0, а два діаметрально направлені вектори мають подібність -1, незалежно від їх довжини. Косинус подібності часто використовують в позитивному просторі, для якого результат обмежений проміжком . Назва походить від терміну «направлений косинус»: в цьому випадку одиничні вектори максимально «подібні», якщо вони паралельні і максимально «різні», якщо вони ортогональ (uk)
- Коэффициент Отиаи (мера Отиаи, коэффициент Оцуки — Отиаи, коэффициент Отиаи — Баркмана, косинусный коэффициент, геометрический коэффициент) — бинарная мера сходства, предложенная японским биологом Акирой Отиаи в 1957 году, в дальнейшем обобщенная и нашедшая применение в разнообразных приложениях и за рамками биологии. В стандартном определении коэффициент для двух произвольных множеств и вводится следующим образом: , где — мощность множества . Часто используется мера Отиаи, возведённая в квадрат: . Для случая дескриптивных множеств коэффициент Отиаи вычисляется следующим образом: , . (ru)
|