离散化是一种常用的技巧,有时数据范围太大,可以用来放缩到我们能处理的范围。
比如:数的范围0---999 999 999,而数的个数N不大于500000,故给出的数一定可以与1.。。。N建立一个一一映射;
例: int a[] = {10000000, 10, 2000, 20, 300};
那么离散化后a[] = {5, 1, 4, 2, 3},是一个一一对应关系,而且满足原来的大小关系,
有些情况下它们可以互相替代。
下面是代码:
import java.util.Scanner;
import java.util.Arrays;
import java.util.Comparator;
class Node implements Comparable{
int val;
int no;
public int compareTo(Object o) {
return this.val - ((Node) o).val;
}
}
public class Test{
public static void main(String args[]){
Node[] p=new Node[5];
int[] a=new int[5];
//int a[] = {10000000, 10, 2000, 20, 300};//那么离散化后a[] = {5, 1, 4, 2, 3}
Scanner in=new Scanner(System.in);
for(int i=0;i<5;i++)
{
p[i]=new Node();
p[i].val=in.nextInt();
p[i].no=i;
}
Arrays.sort(p);
for(int i=0;i<5;i++){
a[p[i].no]=i+1;
}//以上是使其离散化
for(int i=0;i<5;i++)
System.out.print(a[i]+" ");
}
}
运行:
C:\ex>java Test
10000000 10 2000 20 300
5 1 4 2 3
分享到:
相关推荐
在计算几何问题中,离散化方法是一种较为通用的算法,在解决一些与矩形等直线型有关的题目时,能大大降低算法的时空复杂度。但当问题与圆相关时,直接离散化法有较大困难。本文讨论了离散化法在这类问题中的方法,...
随着数据挖掘和知识发现等技术的迅速发展,出现了很多数据离散的算法,但是,已有的离散化方法大多是针对固定点上的连续属性值的情况,实际应用中大量存在着连续区间属性值的情况。针对这一问题,提出了一种连续区间...
1995一种离散化的方法1
一种基于深度学习的离散化交通状态判别方法.pdf
提出了一种基于聚类方法的无监督连续属性离散化算法,称为CAMNA(Clustering and Merging on Numerical Attribute)算法。CAMNA算法通过聚类过程将数值值域划分为多个离散区间,根据类分布的指导信息优化合并相邻...
这是一篇2008年6月的硕士论文,详细的介绍了有关朴素贝叶斯 离散化的几种算法 包括EMD,PKI,muti_EMD,和weka中离散化的方法等等
摘要:连续属性离散化的关键在于合理确定离散化划分点的个数和位置。为了提高无监督离散化的效率 ,给出一种基于熵的连续属性离散化方法。该方法利用连续属性的信息量
针对机器学习领域中的诸多优秀算法只能处理离散属性的特点,提出一种基于词出现和信息增益相结合的多区间连续属性离散化方法(multi-interval discretization based on term presence and information gain,MTPIG)...
一种基于BP神经网络的离散化方法.pdf
引进了一种离散化方法对分数阶时滞微分方程进行离散化求解。首先考察Wright分数阶时滞微分方程;其次分析相应具有分段常数变元的Wright分数阶时滞微分方程,并应用离散化过程对模型进行数值求解;然后根据不动点理论...
龙格-库塔(Runge-Kutta)方法是一种在工程上应用广泛的高精度单步算法,用于数值求解微分方程。由于此算法精度高,采取措施对误差进行抑制,所以其实现原理也较复杂。4阶龙格库塔方法离散化Mackey_Glass时间序列,
粗糙集理论用于数据挖掘要求连续数据离散化,在分析目前的离散化算法的基础上,提出了一种局部离散化方法,以期降低断点、规则数量。使用此算法在模拟电路故障数据上进行的试验,表明其性能较好。
通过将连续属性离散化和属性约简结合起来,首先对连续型的属性列进行离散化,得到新的决策表;然后再对新的决策表作属性约简,解决了属性约简过程中由于不考虑连续属性而无法求出准确约简属性的问题。最后通过具体...
一种属性离散化的方法,对粗糙集适用
针对基于信息熵的离散化方法的不足,提出了一种应用相似性度量理论将数值型属性进行离散化的方法.数值型属性离散化后,每一个区间所获得的信息量用一个叫做代数-几何平均数距离公式的相似性度量公式来度量;区间的数目...
提出一种连续属性值域划分的离散化新方法,该方法定义一个新的离散化函数,依据类与属性之间的相互依赖关系选择最优的离散区间列表;此外,采用变精度粗糙集理论合理地控制数据离散化产生的信息丢失,减少分类错误。...
在机器学习和数据挖掘领域,数值属性离散化是一个重要的研究课题.本文对现有的基于粗糙集理论的数值 ...现有的改进算法的不足,提出了一种新的Naive Scaler算法的改进算法,最后通过算法示例验证了该算法的有效性和可行性.
针对此不足,在保证决策属性绝对不改变的情况下,提出一种新的区间拆分方法,更合理有效地对连续属性进行离散化。实验通过C4.5和支持向量机分别对离散化后的数据进行识别与分类预测,实验结果证明了算法的有效性。
我们在数值上探索了连续体SU(N c)Yang-Mills理论在欧几里德时空晶格上的另一种离散化方法,最初是由Budzcies和Zirnbauer引入的规范组U(N c)。 可以重新离散化,以使规范场的自相互作用由N b个辅助波场上的积分...