数得明白-用C#制作源代码统计软件

来源:岁月联盟 编辑:zhu 时间:2007-02-08
  我们在招聘会上经常看到这样的要求:“熟练使用XX语言,有X万行源码经验”。确实,编码行数在一定程度上反映了编程水平。那么,我们如何从数以百计、千计的源程序中快速得知究竟有多少行呢?利用Visual C # 2005和c#语言特性,我们可以轻松实现对多种类型的源代码的行数的统计工作。

  一、需求分析

  程序需要用户输入要过滤的源程序的拓展名,选择要统计的目录。获得信息后,程序需要遍历指定目录(及其子目录)和目录下的文件,这一过程可以用System.IO.DirectoryInfo类来实现。对于符合过滤标准的文件,我们用StreamReader类来打开它们,每次读取一行并计数,直到EOF为止,于是便得到了文件的行数。

  二、数据结构与算法

  对于每个过滤到的文件,我们用一个结构来储存其信息。

  struct codeInfo

   {

   public long line; //储存这个源程序的行数

   public string ext; //这个文件的拓展名

   public string filename; //文件名

   public string fullname; //全路径加文件名

   //篇幅所限,省略了仿“构造函数”。该函数对结构体进行初始化。详见源代码。

  };

  对于用户会输入多少种拓展名,以及会有多少符合标准的文件,都是未知的。特别是对于每个文件都要动态构造一个codeInfo结构体,考虑到这些,我们用ArrayList来动态管理这些结构体。

  在算法上面,采用递归来实现无穷级目录遍历这一功能。   三、窗体设计

  启动VisualStdio2005,新建一个基于c#的“Windows应用程序项目”。在自动创建的form1上添加如下控件:

  控件类型及数量 作用

  button两个 点击button1选择文件夹,点击button2开始统计

  textBox一个 供输入拓展名

  label1五个 用于静态提示的表示

  listBox一个 显示最终的分类统计结果

  另外,如果想详细的显示每个统计的源文件的详细情况,可以再添加dataGridView控件,利用它对每个文件的名称、行数、路径,进行详细显示。篇幅所限,本文略去所有控件的属性设置,详见源程序。设计好的窗体如图1。

  四、部分程序的实现

  1、递归实现遍历目录及获取文件长度

  //参数说明:ext是包含多个拓展名的字符串数组,dir为查找目录,list为集合的类的引用,用于动态存储codeInfo结构

   void count(string[] ext, string dir, ref ArrayList list)

   {

   DirectoryInfo di = new DirectoryInfo(dir); //新建对象,用目录作为构造参数

   DirectoryInfo[] d = di.GetDirectories(); //托管数组d存了方法返回的所有子目录信息

  

   foreach (DirectoryInfo dCur in d) //对子目录进行遍历

   {

   foreach (string extCur in ext) //按照每个拓展名分别查找

   {

   FileInfo[] fi = dCur.GetFiles(extCur); //获得当前目录下满足拓展名的文件(用拓展名做构造参数)

   foreach (FileInfo fCur in fi) //遍历每个文件

   {

   //实现统计文件的行数

   long n=0;

   StreamReader sr = new StreamReader(fCur.FullName);
   while (!sr.EndOfStream)

   {

   n++;

   sr.ReadLine();

   }

   codeInfo a = new codeInfo(n, extCur, fCur.Name, fCur.FullName); //存储这个文件的信息

   list.Add(a); //将该文件信息加入到集合列表中

   }

   }

   count(ext,dCur.FullName,ref list); //递归遍历子目录的子目录

   }

   }

  2、button2的部分代码

  注:codeList为Arraylist集合

  private void button2_Click(object sender, EventArgs e)

   {

   string[] ext = getExt(textBox1.Text);

   listBox1.Items.Clear();

   codeList.Clear(); 
  //省略判断拓展名是否合法及目录是否为空,详见源码

   count(ext, label3.Text, ref codeList); //调用统计函数

   if (codeList.Count == 0)

   listBox1.Items.Add(" 没有找到指定扩展名的源文件!");

   else

   {

   listBox1.Items.Add(" 共找到" + ext.Length + "种源文件");

   listBox1.Items.Add(" ");

   codeInfo typecur = (codeInfo)codeList[0];

   long numcur = 0, linecur = 0, lineall = 0;

  //下面按照文件名分类统计不同扩展名源程序的总行数

  foreach (string extcur in ext)

  {

   numcur = 0;

   linecur = 0;

   for (int i = 0; i < codeList.Count; i++)

   {

   codeInfo cur = (codeInfo)codeList[i];

   if (extcur == cur.ext)

   { 
   numcur++; linecur += cur.line;

   }

   }

   lineall += linecur;

   listBox1.Items.Add(string.Format(" {0,-8}" + numcur + " 个文件 " + linecur + "行", extcur)); //统计完一种拓展名后向Listbox添加一行信息

   }

   listBox1.Items.Add(" 总计" + codeList.Count + "个文件 " + lineall + "行");

   }

   }

  在实现过程中,还牵扯到:对输入的拓展名进行分割、填充dataGridView的行/列以显示所有统计文件的详细信息等问题。篇幅限制,不做介绍,详见代码。

  五、提高篇

  我们可以新建一个Form专门停放dataGridView(更好的显示效果)。这样就牵扯到了窗体间如何传递codeList集合的问题。提示大家可以用this仿“指针”进行传递。

  本程序只有一个待统计目录,有兴趣的朋友可以考虑:如何设置多个待统计目录(多一层foreach)。

  另外,采用StreamReader获取文件行数的方法再极端大的源码样本运行时会略显慢,大家可以考虑采取其它优化的办法,比如:利用统计学原理找到一个常数(平均每行字符数),然后用文件长度处以这个数以得到行数,当然,这样会降低统计精度。

  至此,我们已经体验了Visual C# 2005的强大功能并成功实现了这一软件。本程序在Visual C# 2005 WindowsXP SP2下调试通过。